圖靈學院
科楠
2024-12-28
近期由華盛頓州立大學(Washington State University)領導的一項研究發現,雖然大型語言模型(LLM)如ChatGPT在金融從業資格考試的選擇題上表現出色,但在處理更為複雜的任務時仍存在明顯不足。
該研究評估了BARD、Llama和ChatGPT等AI模型對超過10,000道金融考試題的回答能力。研究人員不僅考察了這些模型選擇正確答案的能力,還要求它們對選擇進行解釋,並將這些解釋與人類專家的答案進行比較。結果顯示,雖然ChatGPT在綜合廣泛概念方面表現優異,但在處理如確定保險覆蓋範圍或評估併購交易等專門問題時,準確性明顯下降。
研究的主要作者DJ Fairhurst指出,對於已在網路上有詳細解釋的廣泛概念,ChatGPT能夠很好地進行綜合,但在面對特定且獨特的問題時,則顯得力不從心。
研究還發現,付費版本的ChatGPT 4.0在回答問題的準確性和與人類專家答案的相似度方面表現最佳,其準確率比其他模型高出18至28個百分點。然而,經過精調的免費版本ChatGPT 3.5在提供與人類專家相似的答案方面,甚至超過了ChatGPT 4.0。
儘管如此,這些模型在處理某些類型的問題時仍存在不足。例如,在審查證券交易和監控金融市場趨勢方面,模型表現良好,但在確定客戶的保險覆蓋範圍和稅務狀況等專門情況下,答案的準確性則有所下降。
這項研究表明,雖然ChatGPT等AI模型在某些金融任務中具有潛力,但在處理需要專業知識的複雜問題時,仍無法完全取代人類專家。因此,在依賴這些模型進行財務決策時,應謹慎行事,並考慮尋求專業財務顧問的建議。
Reference:
“How Much Does ChatGPT Know about Finance?” by Douglas (DJ) Fairhurst and Daniel Greene, 18 November 2024, Financial Analysts Journal.DOI: 10.1080/0015198X.2024.2411941
Copyright © 2024 利創智能科技股份有限公司 All rights reserved.
Replace this text with information about you and your business or add information that will be useful for your customers.