ESI ULM
首頁 意見解釋算法

解釋算法

弗朗西斯科·帕斯誇爾·羅梅羅·奇查羅

解釋算法

通過 弗朗西斯科·帕斯誇爾·羅梅羅 (美國計算機工程碩士協調員)

本周有消息稱,不幸的是,西班牙道路上有 26 人死亡。 這改進了大數據的預測,或者更確切地說,利用大數據的人工智能算法的預測是 36。  

這個預測產生了幾個問題,首先,一個絕對數字通常不會被預測或預測,預測的結果通常會稍微複雜一些,例如,提供數字的置信度或它在哪個區間這個數字更可靠。 單個數字對觀眾來說是很好的數據,但並不是真正有用。

另一方面,在很多情況下,計算數字的過程比數字本身更有價值。 據推測,已經考慮了時間序列、氣象情況等變量來獲得“36”。 了解影響預測的因素是幫助決策制定的最有價值的因素之一。

最後,還有預測本身的失真。 當你預測某些現象時,你已經影響了它。 這是我從老師那裡學到的 何塞·安吉爾·奧利瓦斯 20多年前,它仍然有效。 例如,DGT 使用該數字通過廣告活動來調節我們的行為,試圖讓我們在駕駛時更加小心。 也就是說,使用“大數據”以使“大數據”無法正確處理,因​​為重要的不是正確處理,而是減少道路上的死亡人數。

另一個例子:澳大利亞公開賽的納達爾。

大家看到了納達爾在上屆澳網決賽中戰勝梅德維德的4%機率的畫面。 隨後的標題類似於“納達爾擊敗大​​數據”等。 幾週後,馬爾科·阿森西奧打進了一個進球,根據電視上顯示的模型,這個進球有 10% 的機會成為進球。 隨後,相同的頭條新聞,可能發生在我們身上的是,當我們指向月球時,我們看著手指,我們沒有意識到這些數字背後是什麼。

概率與可能性。 4% 的概率表明納達爾的勝利是有可能的,網球計分系統更是如此。 這不是不可能的事件,它是罕見的,但也不是不可能的。 讓我們停下來,每年21月0,001日,我們都認為第二天我們會中彩票頭獎,概率為XNUMX%,我們一直認為這是可能的。

模型如何計算這個數字? 首先,使用先驗概率,其中納達爾贏得比賽的概率為 36%。 通常,這些先驗模型基於排名(高於梅德韋德的)、過去的連勝記錄、比賽場地、最後一場比賽等。 然後是黨的未來; 以一個簡單的模型來分析類似的歷史情況,在 4 場比賽中,只有 100 場比賽中有 5 場有類似的結果被追溯。 如果我們專注於納達爾,在那種情況下,他只參加了 2 場比賽中的 20 場。 所以這個數字是合理的,但它是否給了我們足夠的信息?

你怎麼得到這個數字? 一個數字是一個瞬間,而珍惜一個瞬間,我們就會失去部分故事。 讓我們記住海森堡的不確定性原理:如果我們非常精確地評估一個變量,我們就會失去對其他變量的看法。 另一方面,從 4% 達到 1% 與從 32% 下降不同。 不僅如此,不僅需要評估這個數字,還要評估它在比賽后期是如何演變的,以及在第三盤中挽救破發球或破發等不同事件如何極大地改變這個概率勝利。 這些事件,了解和分析它們是本次分析的關鍵。

我怎樣才能改變這個概率? 這是數字的有用部分,如果你在給定時刻告訴玩家他有 4% 的獲勝機會,你並沒有給他任何新東西,他通過查看記分牌就知道了。 重要的是你的遊戲中發生了什麼導致你失敗,以及你如何改變這種動態。 也就是說,有用的是說:“看拉法,他贏得了你在二發中投出的所有分數,而且你沒有任何雙重失誤,記住這一點”或“發球”他把你扔給你,你會輸掉 90% 並且反彈不到 3 個球”。 這對球員和教練來說都是有用的,這就是應用這些算法和模型的真正用處。

總之,孤立的數字就是那些數字,但它們需要一個上下文和詳細的分析,不需要對它們進行任何“數字”解釋。 算法和模型可以提供更多信息和相關知識,讓您了解行為以及如何獲得更好的結果。

與某人分享:
評價這個項目