天天看點

如何用機器學習預測超售,避免美聯航“暴力趕客”悲劇

如何用機器學習預測超售,避免美聯航“暴力趕客”悲劇

應付不可預測地改變計劃的乘客是航空公司面臨的許多後勤挑戰之一:個人的行程常有意外,而當個人行程累計,飛機上很可能隻有一半的乘客。這讓航空公司不滿,造成了額外的污染,也是美聯航等航空公司超售的主要原因。

不幸的是,航空公司處理他們面對的困難時并不總是很優雅,正如美聯航“暴力驅客”的故事那樣。一個特定的航班被超量預訂,沒有人想放棄他們的機票來換取航班信用積分。在所有可能的選擇中,美國聯合航空公司決定強制執法,将一名倒黴的乘客拖下飛機。 這個事件的視訊最後被釋出到了youtube上,引發了海嘯般的反應。

事實上航空公司的超售有着很好的理由:它具有良好的經濟意義。飛機上有多少座位就隻銷售多少座位不僅不利于企業,而且對環境也不好,對乘客也不利。

如何用機器學習預測超售,避免美聯航“暴力趕客”悲劇

上邊的漫畫說明:很多人想買機票去某些地方。飛機有一百個座位是以隻出售100個座位。但是一些人改變了他們的主意。他們被收取高額的改簽費用,否則就會失去整張機票。飛機上隻有一半的乘客讓航空公司不滿,造成了額外的污染,也讓他們提高了票價。

航空公司應該如何使用大資料?

航空公司依靠大資料,收集有關所有客戶及其行為的海量資料和資訊。他們知道你什麼時候飛,你往哪裡飛,你喜歡什麼座位,你家在哪裡,還有其他更多的資訊。航空公司應該(有時确實這麼做了)使用資料科學來最大限度地提高您的舒适度,幸福度,最終将盈利最大化。使客戶更快樂對企業有利。航空公司應該使用機器學習來解決問題。機器學習隻是使用曆史資料來建構一個可以對未來事件做出預測的模型。例如,既然我的航空公司過去已經飛了數以千計的班次,我的資料應該告訴我明天航班被超額預定的可能性。

估算不來乘機的人數

也許航空公司要解決的最簡單的問題是估算不來乘機的人數。解決這個問題最簡單的辦法就是把曆史上沒來乘機的人數統計出來,然後取平均值。更複雜的解決方案可能會随季節調整; 例如,冬季月份可能意味着道路狀況會導緻更多的乘客缺席。最複雜的方法可能包括分析交通和天氣資料以預測取消預定和放棄座位的機率。有趣的是,在過去幾年,我見過的超售情況的次數确實有所下降,是以航空公司在這方面的做法可能越來越複雜了。

估計航空公司超售時能提供的福利

即使是最複雜的模型,系統中也總會有一些不可預測性。幸運的是,隻有在您找不到願意乘坐稍後航班的人的情況下,超額預訂才會成為一個麻煩。航空公司通常會提供飛行券甚至現金來激勵人們乘坐稍後的航班。

然而,在這次事件中,這個方法沒有奏效。航空公司可以支付一大筆錢(超過1000美元的現金)給乘客,進而說服他們搭乘稍後的航班。我不能想象那架飛機上沒有一個人願意為了1000美元放棄座位。我的猜測隻能是航空公司補償的不夠罷了。

機器學習可以很容易地用于預測願意以特定的補償率放棄座位的人數。那麼這個優化問題就變得很簡單了。

确定需要主管出面的情況

鑒于機場發生的事故數量之多,每個航空公司都應該有一個自動系統,以便在出現某些情況時向主管發出警報。例如,如果登機口的從業人員無法找到超售航班上願意放棄座位的乘客,則應将資訊自動發送給主管。如果乘客已經登上飛機,但其中有些乘客不得不被趕下去,則應立即自動通知主管。

完全免除改簽費用

當然,就三大航空公司來說,有足夠的資料可以估算出變更航班的人數。 如果任何一家公司收回這項政策——這個政策真的是過去的糟粕——他們就會極大地超越競争對手。退一萬步來說,憑什麼不取消超售航班的改簽費用?

确定為什麼人們不想放棄自己的座位

雖然能夠識别那些可能會提供座位的乘客會很有用,但是了解客戶為什麼這麼做會更有價值。這一點資料科學也可以做到。征信機構一直在通知客戶為什麼他們的信用評級多年來總是下降——主要是通過監管。同樣的技術也應該用來幫助航空公司了解客戶為什麼做出那樣的選擇。(據我所知,datarobot是唯一可以使這些原因代碼用于所有現成模型的機器學習平台)

随時更新這些模型

航空公司建立的預測模型都不會持續很長時間,因為世界在不斷變化。人們會改變,他們的習慣會改變,住所也會改變。這意味着這些模型會比其他類型的模型老化得更快。能夠快速地疊代現有的模型進行改進和更新是保持領先的關鍵。 

那麼他們為什麼不這樣做呢?

事實是,做資料科學很困難。因為很難找到同時有數學技巧和編碼能力的人,并且他們還要清楚怎麼才能做好航空公司業務。不僅如此,商界人士和管理人員也很難在自己的業務中找出利用這項技術真正的商業機會。如果他們不了解,他們就不會優先考慮它,是以也就不會做這件事。我看到這種情況發生在數百家公司裡,航空公司也沒有什麼不同。

自動化才是解決方案

在大多數情況下,手工編碼的預測模型是一種過時的模組化方法。像datarobot這樣的工具可以讓商業分析師像資料科學家一樣能夠在短時間内順利地建立預測模型。這意味着積壓的項目可以盡快的完成,能夠避免上述事故的人工智能将得以建立,而且競争對手會疑惑究竟哪裡出了錯。自動化正是每年建立幾個模型和每年執行幾百個人工智能解決方案的差別所在。它也是把你的客戶從飛機上拖下來和把你大筆的錢存到銀行之間的差別。

原文釋出時間為:2017-04-17

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀