本发明提供了一种基于Q学习的地铁列车节能驾驶曲线计算方法,包括:S1根据实际线路信息和车辆信息建立列车控制模型;S2设置Q学习的各个参数;S3根据列车基本运行工况选取一条列车驾驶曲线作为初始解;S4向线路中的区间分配能量,更新初始解,并根据设置的Q学习的各个参数和列车运行片段进行训练,并根据Q学习更新公式更新值函数;S5根据预定条件判断值函数是否收敛到最优值函数,若收敛,则根据所述最优值函数得到最优能量分配策略和节能驾驶曲线;若不收敛,则返回至步骤S3。本方法得到的地铁列车节能驾驶曲线可以降低列车运行能耗,并符合运行时间要求。