天天看點

2023年美賽數學模組化C題思路模型分析(預測單詞結果)

背景

Wordle是《紐約時報》目前每日提供的一個熱門謎題。玩家嘗試在六次或更少的嘗試中猜出一個五個字母的單詞來解決謎題,每次猜都會收到回報。對于這個版本,每個猜測必須是一個實際的英語單詞。不允許比賽中未識别為單詞的猜測。Wordle繼續受到歡迎,目前已有超過60種語言的遊戲版本。

《紐約時報》網站對Wordle的說明指出,送出單詞後,瓷磚的顔色會發生變化。黃色平鋪表示該平鋪中的字母在單詞中,但它位于錯誤的位置。綠色平鋪表示該平鋪中的字母在單詞中,并且位于正确的位置。灰色平鋪表示該平鋪中的字母根本不包含在單詞中(見附件2)[2]。圖1是一個示例解決方案,在三次嘗試中找到了正确的結果。

2023年美賽數學模組化C題思路模型分析(預測單詞結果)

玩家可以在正常模式或“硬模式”下進行遊戲。Wordle的硬模式要求玩家一旦在單詞中找到正确的字母(瓷磚為黃色或綠色),就必須在随後的猜測中使用這些字母,進而使遊戲更加困難。圖1中的示例是在硬模式下播放的。

許多(但不是所有)使用者在Twitter上報告自己的分數。針對該問題,MCM已生成2022年1月7日至2022年12月31日的每日結果檔案(見附件1)。該檔案包括日期、比賽編号、當天的單詞、當天報告分數的人數、硬模式下的玩家人數,以及在一次嘗試、兩次嘗試、三次嘗試、四次嘗試、五次嘗試、六次嘗試中猜到單詞或無法解開謎題的百分比(用X表示)。例如,在圖2中,2022年7月20日的單詞是“TRITE”,結果是通過挖掘Twitter獲得的。盡管圖2中的百分比總和為100%,但在某些情況下,由于四舍五入,這可能不正确。

2023年美賽數學模組化C題思路模型分析(預測單詞結果)

要求

《紐約時報》要求您對本檔案中的結果進行分析,以回答幾個問題。

  • 報告結果的數量每天都在變化。開發一個模型來解釋這種變化,并使用您的模型為2023年3月1日報告的結果數量建立一個預測區間。單詞的任何屬性是否會影響在硬模式下播放的報告分數百分比?如果是,怎麼辦?如果沒有,為什麼不呢?
  • 對于給定的未來解決方案單詞,在未來的日期,開發一個模型,使您能夠預測報告結果的分布。換句話說,預測未來日期(1,2,3,4,5,6,X)的相關百分比。你的模型和預測有哪些不确定性?舉一個具體的例子,說明你對2023年3月1日EERIE一詞的預測。你對模型的預測有多自信?
  • 開發并總結一個模型,根據難度對解決方案單詞進行分類。識别與每個分類相關的給定單詞的屬性。使用你的模型,EERIE這個詞有多難?讨論分類模型的準确性。
  • 列出并描述此資料集的一些其他有趣的功能。
  • 最後,在給《紐約時報》拼圖編輯的一到兩頁信中總結你的結果。

思路分析

C題是資料挖掘題,通過分析wordle的遊戲機制,挖掘不同單詞所對應的得分情況對其難度的影響,這道題的難度主要是如何提取不同單詞難度的特征,相對來說反而是最好實作的。

更多思路:永久更新,全網最新最全,持續更新中,檢視最下方QQ群擷取。