編者按:本文數據獲取及統計分析時間為2018年9月,部分數據特征及結論可能與春運時間段不一致。
春節想肥家 想去浪
沒有火車票怎么辦
我們就一起來根據12306數據看看
余票放票究竟有沒有規律
是完全靠人品
還是有一定規律可循?
▍十行代碼帶你獲取12306余票數據
– 通過url獲取網頁數據
我們選擇在12306網站上獲取數據
大家對這個界面應該相當熟悉
然后在網頁空白處右鍵——審查元素
在Network界面找到Request URL這個url就包含余票信息
我們再用python做一個簡單的數據清洗
余票數據就爬取成功了


– 利用python,構建余票自動爬取代碼
我們利用python的schedule庫
構建全天候運行的數據代碼
不斷獲取余票數據
這里受篇幅所限我就不贅述啦
▍到底什么樣的火車票是有機會搶到的
– 大區間有票 小區間無票
理論上來說,任何時段的火車票都有機會搶到,因為一旦有退票返回系統,12306基本上會實時返回余票庫。
我們這里指的搶票,定義為遠程大區間車票還有余票,又距離開車時間相對較短,鐵路部門因為希望減少空載率,實現利潤最大化而將遠程車票分開售賣。
舉個栗子:
如果小長假想去平遙古城玩兩天 ,我們先來看看火車票:


系統顯示G627二等座已全部賣光,一等座也只剩一張,平遙古城是不是去不成了呢?當然不是,我們發現平遙古城并不是終點站,該車次終點站是運城北。
搜索北京到運城北看看結果:


結果顯示北京到運城北票源充足,余票量大于99張。在此,我們先大膽的進行猜測,鐵路部門覺得全程的余票賣不完了,為了減少空載率,拆開賣也能接受的時候,就會有大量的余票放出。接下來,我們一起來驗證看看這些余票到底是怎么放出的?
▍大數據來解析余票放票時間
由于12306改版,余票超過20張時不會顯示具體數量,顯示為“有”,但實際上,在12306購票提交訂單之前,系統仍會提示實際的余票數。


但是登陸之后長時間的爬蟲容易對賬號產生不良的影響,所以建議還需要爬取實際票數的朋友們要謹慎,退一步可以選擇其它代售網站,余票數一般可顯示至99張。
在此非常感謝鄭濤老師提供的含有準確余票信息的源數據,數據為連續七日當日火車票余票數,采集間隔為1分鐘。我們一起來探討火車票余票的放票方式。
– 同一趟列車,不同站點的放票時間是否相同?
同趟列車,不同站點的放票時間是否相同,即放票時間是否與車站有關。為了驗證這個問題,我們選取了D306次同一日,三個區間的余票情況進行分析比較。


結果顯而易見,我們發現三個區間站的放票時段集中在中午12時和下午18時30分,三個區間站沒有明顯的差異,即此趟列車余票的放票時間基本不會因車站的不同而有差異。
– 同一趟列車,不同日期放票時間是否一樣?
我們還以D306次為例,看看連續三天D306次當日的余票信息。


我們可以看出,三天雖然余票數不盡相同,但每天的18:25分到18:30分,均有大量的余票放出,三日的放票時間十分接近,所以D306上海到南京區間的放票時間在這三日是相對固定的。
這是一個普遍現象還是個例?我們來把時間拉長,看看七日的數據還符不符合這個規律。


從表中可以看出,答案是肯定的,不同日期D306車次釋放余票的時間基本相同,我們再來看看其它幾個車次。




除此之外,小編還觀察了G1252-蘇州到無錫、G7072-丹陽到南京、G7244-無錫到鎮江等合計20趟列車不同日期相同區段當日余票的放票情況,發現以上20趟列車的放票時間也有一個相對固定的時刻。
– 那么,究竟提前多久時間能搶到放出來的余票?
我們將20趟列車的“發車——放票時間”做成一個柱狀圖,來看看其中有沒有什么規律。


從上面的數據來看,每趟列車的放票時間不盡相同,但是我們發現了兩個數據非常密集的區段,開車前7小時(420分鐘)和開車前1小時(60分鐘),我們在實際的搶票過程中可以重點關注這兩個時間段。


再來看看這20趟列車每日放票的時間差,并制箱型圖,發現絕大部分車次不同日的放票時間差距很小,與我們之前個體數據的規律基本相符。
總結與展望
1.通過本次樣本數據的分析,車輛余票放票的時間與車站不存在直接關系,而是因車票而異。
2.在大區間有余票的情況下,小區間放票的時間相對固定,這個時間是存在的,但因車次而異,而且不受12306網站停止服務影響的,絕大多數情況下也不是整點,例如早九時發車的D3022,會在凌晨兩點左右放票。在確認大區間有票的情況下,提前7小時和1小時觀察該車次的放票情況,有更高概率發現車輛的放票時間。
3.此次余票分析僅限于當日車次9-24小時的放票分析,勢必存在著一定的局限,由于現在預售期為30天,小編也會繼續關注,有了更完整的放票攻略會及時再與大家進行分享哦!
我想來一場說走就走的旅行
還有什么搶票的小Tips
1.12306每天早上6點開始售票,不論是晚上是該次列車固定的余票放票時間,還是有人在火車站退票改簽,早6點都是在網絡售票的起始時間,可以搶到昨晚累積的余票。
2.關于第三方搶票軟件,我想分享一點自己的經歷。為了讓旅客購買流量疊加包,軟件會顯示區間搶票人數,熱門路線動輒成千上萬,你又排在第幾位?當然,第三方軟件也幫我搶到了很多火車票,搶票軟件的優點是非常節約時間。但是在部分熱門路線,小編就親身經歷過軟件沒搶到票,但手動搶到票的經歷。
3.再說兩條與技術無關的純經歷 ,一是高鐵動車短途買票,短區間仍有余票,長區間基本無票,可以采取上車補票的措施。
4.跨區間購票,很明顯的就是本科的時候蘇杭實習回北京,從蘇州到北京的臥鋪票基本買不到,反而大家購買的區間都是上海到北京,在價格相差不多的時候,我們還可以考慮跨區間購票。
版權聲明:本文內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容, 請發送郵件至 舉報,一經查實,本站將立刻刪除。