為什麼不能完全信任ChatGPT的財務建議？最新研究揭示其潛在風險與限制

圖靈學院內的文章包含三大主題：ESG浄零實驗室、AI實驗室及精實管理實驗室，我們會不定期分享相關主題之文章，也歡迎並對前述主題有興趣的學員投稿分享您的見解 (我要投稿)

圖靈學院創辦人科楠老師的願景

為什麼不能完全信任ChatGPT的財務建議？最新研究揭示其潛在風險與限制

圖靈學院
科楠
2024-12-28

近期由華盛頓州立大學（Washington State University）領導的一項研究發現，雖然大型語言模型（LLM）如ChatGPT在金融從業資格考試的選擇題上表現出色，但在處理更為複雜的任務時仍存在明顯不足。

該研究評估了BARD、Llama和ChatGPT等AI模型對超過10,000道金融考試題的回答能力。研究人員不僅考察了這些模型選擇正確答案的能力，還要求它們對選擇進行解釋，並將這些解釋與人類專家的答案進行比較。結果顯示，雖然ChatGPT在綜合廣泛概念方面表現優異，但在處理如確定保險覆蓋範圍或評估併購交易等專門問題時，準確性明顯下降。

圖:四種LLM的正確(精確度) (Fairhurst et al., 2024)

研究的主要作者DJ Fairhurst指出，對於已在網路上有詳細解釋的廣泛概念，ChatGPT能夠很好地進行綜合，但在面對特定且獨特的問題時，則顯得力不從心。

研究還發現，付費版本的ChatGPT 4.0在回答問題的準確性和與人類專家答案的相似度方面表現最佳，其準確率比其他模型高出18至28個百分點。然而，經過精調的免費版本ChatGPT 3.5在提供與人類專家相似的答案方面，甚至超過了ChatGPT 4.0。

儘管如此，這些模型在處理某些類型的問題時仍存在不足。例如，在審查證券交易和監控金融市場趨勢方面，模型表現良好，但在確定客戶的保險覆蓋範圍和稅務狀況等專門情況下，答案的準確性則有所下降。

這項研究表明，雖然ChatGPT等AI模型在某些金融任務中具有潛力，但在處理需要專業知識的複雜問題時，仍無法完全取代人類專家。因此，在依賴這些模型進行財務決策時，應謹慎行事，並考慮尋求專業財務顧問的建議。

Reference:
“How Much Does ChatGPT Know about Finance?” by Douglas (DJ) Fairhurst and Daniel Greene, 18 November 2024, Financial Analysts Journal.DOI: 10.1080/0015198X.2024.2411941

聯絡我們

電話: 04-37-031-031

傳真: 04-2473-3865

電子郵件: info@ibco.com.tw

地址: 台中市烏日區高鐵三路29號12F-1

歡迎訂閱IBCO電子報隨時更新最新ESG/AI議題

Replace this text with information about you and your business or add information that will be useful for your customers.

圖靈學院內的文章包含三大主題：ESG浄零實驗室、AI實驗室及精實管理實驗室，我們會不定期分享相關主題之文章，也歡迎並對前述主題有興趣的學員投稿分享您的見解 (我要投稿)

圖靈學院創辦人 科楠老師的願景