AMP-專家談GPT-4:Google是圖書館員,ChatGPT是口譯員,腦補是難免的
2023/03/24



我們想讓你知道的是

如果我們將這兩個角色擬人化之後,Google是一個圖書館員,它不會告訴你任何東西,只會幫你找東西。ChatGPT是一個會超級多語言的口譯員,它不會幫你找東西,但是很愛幫你「翻譯」或「轉譯」,也很樂於自己補充。簡單來說,前者是用「查」,後者用「翻譯」。

議題背景
OpenAI在今(2023)年3月14日正式推出GPT-4,比起先前的GPT-3.5回答問題更精準,還可以請GPT-4解讀圖片。OpenAI共同創辦人Greg Brockman也用YouTube影片示範GPT-4的特點與限制。

英國的《衛報》也報導,OpenAI表示GPT-4接受了互聯網上大量資料的訓練,因此改進了很多原本GPT-3的問題並且更有創造力,但用戶在使用語言模型輸出的答案時仍應格外小心,建議再人工檢查過內容。


相關資訊:

OpenAI GPT-4公開資訊:GPT-4
OpenAI GPT-4預印本平台的技術報告:GPT-4 Technical Report
英國《衛報》:OpenAI says new model GPT-4 is more creative and less likely to invent facts
CNN新聞:The technology behindChatGPTis about to get even more powerful

一起來看看專家怎麼說。

蔡宗翰(國立中央大學資訊電機學院資訊工程學系教授)
2023年03月16日

1. GPT-4的優勢和限制分別是什麼?


GPT-4是目前為止最強大的語言模型之一,它的優勢在於,GPT-4現在使用更多的訓練資料和計算資源,能夠更準確地回答問題和生成文字,並減少語言偏見的影響。

此外,GPT-4透過學習大量的文字和圖像資料,獲得更高的創造力和想像力,能生成更有趣和獨特的文字和圖像描述。而且,它也具備解讀圖片的能力,可以從圖像中發掘關鍵資訊並生成相關的文字描述。

值得注意的是,GPT-4必須要有大量的計算資源才能運行和訓練,因此在某些設備上可能會難以實現,且會消耗大量的能源。此外,即使GPT-4的準確性比之前的版本更高,仍有可能出現一些錯誤,因此在使用時需格外小心,並進行進一步的確認。

2. 根據您的研究經驗,GPT-4解讀圖片且生成文字的能力,還可以從哪些方面精進呢?是否需要開發新的演算法,或是給予更多高品質的訓練資料?

目前來看,GPT-4在解讀圖片和生成相關文字方面已經取得了很大的進展。但是,這種技術還存在一些限制和挑戰。例如:圖像和文字之間的關聯是一個複雜的問題,目前的語言模型在這方面仍存在一定的局限性。為了進一步提高模型的準確性和精確度,需要開發更先進的演算法和技術。

GPT-4在生成文字時可能會編造非事實性的回答,這可能會對使用者造成誤導和負面影響。為了解決這個問題,可以考慮引入更多的事實驗證機制和檢查機制,同時需要給予模型更加高品質的訓練資料。

另外,語言模型的訓練資料可能存在一定的模型偏見,例如性別、種族、文化背景等方面的偏見。為了解決這個問題,需要更加細緻的調整和訓練模型,同時更加嚴格的審查和檢查模型的輸出結果。

總之,為了進一步提高GPT-4的解讀圖片和生成文字的能力,需要進一步探索和研究相關的演算法和技術,同時也需要給予更多高品質的訓練資料和更加細緻的調整和訓練。台灣必須要有資源投入、深耕,以及研究訓練大型語言模型的技術,絕不能只是使用者,才不會在國際AI軍備競賽中落後。遇到有心者利用GPT-4製造假訊息攻擊時,才有能力判別與解讀假訊息。

3. GPT-4讓大眾對人工智慧的期待更高,但也出現許多擔憂,例如人工智慧可能降低造假門檻與成本。您建議我們如何看待最新的AI生成文字技術,以及在使用上有哪些小撇步和注意哪些事項,以降低從GPT-4得到錯誤資訊的機會?

最新的AI生成文字技術,如GPT-4,具有極高的創造力和生成能力,可以幫助我們更快速、更有效地生成各種類型的文字資料。同時,它也存在一些風險和潛在的問題,例如可能會編造非事實性的回答,產生偏見和不當影響,因此在使用上需要特別注意。

以下是我一些建議的小撇步和注意事項,以降低從GPT-4得到錯誤資訊的機會。

檢查輸出結果:使用者在使用GPT-4生成的文字時,應該始終檢查輸出結果,確保其符合事實和正確性。如果有任何不確定或不正確的地方,應該進一步查證和驗證。

確認來源可靠性:如果從網路上獲取資訊,應該確認其來源的可靠性和真實性,避免受到不可靠的資訊和資料的影響。

使用多種來源:為了避免偏見和局限性,使用者應該使用多種來源的資訊,從不同的角度和視角獲取資料,進行綜合分析和判斷。

注意隱私和安全:在使用GPT-4等技術時,需要注意隱私和安全問題,避免個人資料和機密資訊的外洩和損失。

學習和實踐批判思考:最重要的是,使用者應該學習和實踐批判思考,不盲目相信任何一個模型或技術,並且從不同的角度和角色出發進行思考和判斷,確保獲取到的資料和資訊符合事實和真相。

總之,最新的AI生成文字技術,如GPT-4,為我們帶來了許多便利和效率,但也存在一些風險和挑戰。在使用上,我們應該特別注意其限制和潛在問題,並且採取相應的措施和注意事項,確保獲取到的資料和資訊的正確性和可靠性。


李怡志(國立政治大學傳播學院助理教授)
2023年03月19日
1. GPT-4讓大眾對人工智慧的期待更高,但也出現許多擔憂,例如人工智慧可能降低造假門檻與成本。您建議我們應如何看待AI生成的文章,以及如何辨別內容的正確性呢?


一般人因為先會使用Google才會使用ChatGPT,所以常會以Google的概念來看ChatGPT。Google是一個資料索引目錄,你輸入了關鍵字,索引目錄協助你找到資料。ChatGPT則是學習資料後建立模型,你輸入了提示,他會解讀你的提示之後,給你GPT學會的東西。

如果我們將這兩個角色擬人化之後,Google是一個圖書館員,它不會告訴你任何東西,只會幫你找東西。ChatGPT是一個會超級多語言的口譯員,它不會幫你找東西,但是很愛幫你「翻譯」或「轉譯」,也很樂於自己補充。簡單來說,前者是用「查」,後者用「翻譯」。

因為ChatGPT/ GPT是根據自己的學習來生成「翻譯」,如果它越像人(工智慧),記憶就可能越不齊全,因為人的記憶不是查資料庫那樣完整,所以我們要假設ChatGPT在事實上是可能出錯的,不能完全依賴它完成封閉型(答案只有對錯的,例如「蔡英文的地址」)的事實寫作。

如果我們看到一篇文章,已經註明利用ChatGPT或人工智慧工具完成或協作,我們就要假設裡面的事實可能有錯、會腦補。但假如沒有註明,那就跟平常看到任何文章一樣,隨時保持注意,保持懷疑,如果對於內容有任何疑慮,就回頭求助圖書館員。

2. 依據您使用ChatGPT的經驗,如何正確運用它,以及使用上有哪些小撇步和注意事項,可以以降低從GPT-4得到錯誤資訊的機會?

ChatGPT是一個口譯員,不是圖書館員,所以一定會出錯,所以我們盡量不讓它獨立產生封閉知識型的內容(例如李白的字、號與祖籍)。使用ChatGPT比較好的方式是讓它好好地「翻譯」,讓它提供開放型的內容。也就是說,如果內容有明確的「是非對錯」,最好不要完全依賴它,但如果答案只有「好壞高下」,那麼我們可以開始練習如何使用它。

ChatGPT是一個人工智慧工具,意思是可以理解人話、說人話。但我們也知道,與人溝通向來不簡單,特別是ChatGPT看不到你的表情,也不知道你提問的脈絡,所以你得講更清楚,特別是規範ChatGPT的產出。

有一個簡單的模型可以讓我們更清楚地協助ChatGPT如何溝通,學者David Berlo曾提出SMCR模式,將溝通拆解成:傳播者(Source)、訊息 (Message)、媒體(Channel)及接受者(Receiver)四塊。[1]

例如我想請ChatGPT寫一篇文章「介紹如何使用ChatGPT寫一篇文章」(本文不是這樣寫出來的),如果真的這樣問,「轉譯」出的結果可能很普通。但我們重新限制後,可以說:

請以傳播學者的身分(Source),

針對人文社會科學的大學生(Receiver),

寫一篇文章介紹如何使用ChatGPT寫文章,不要太技術性,語氣親切(Message),

刊登台灣科技媒體中心的Facebook上面(Channel)。


這樣清楚的說明,就可以讓ChatGPT「轉譯」出更好的結果。

(本文為編修版,欲閱讀包含其他專家意見的完整文章請點此

本文經台灣科技媒體中心授權刊登,原文刊載於此
 
資訊來源