2024 年 12 月 4日 - 3:01 下午
30.1 C
Hong Kong
Home生活時尚ChatGPT重大升級 可網絡搜尋及支持圖片、影像傳送及AI語音對話

ChatGPT重大升級 可網絡搜尋及支持圖片、影像傳送及AI語音對話

OpenAI在27日再度重磅宣布,ChatGPT現在可以透過微軟搜索引擎 Bing,進行網路搜尋,解決一直以來資訊停留在2021年9月的痛點。在OpenAI提供的小短片中可以看到,ChatGPT在回答時會告訴使用者這是網路上搜尋的資訊,並附上連結。

根據OpenAI說法,付費服務版本中將新增功能,將在未來兩周內對ChatGPT Plus和企業用戶推出,可讓用戶與AI對話,甚至顯示他們談論有關的內容。

語音功能方面是利用兩個獨立的模型實現,一個是既有的語音轉文字模型Whisper,負責將用戶的對話轉換成文字輸入聊天機器人,以及一個新開發的文字轉語音模型,負責將ChatGPT的回答轉換為語音。

根據OpenAI在官網上的介紹, ChatGPT將提供多達5種合成語音從清晰明亮的女聲到低沉穩重的男聲等不同類型供用戶選擇 。不過OpenAI也提醒,他們的模型在英文文本外的轉錄表現較差,不建議非羅馬文字的語言使用者利用ChatGPT轉錄語音。

例如,OpenAI正與Spotify合作,將Podcast翻譯成其他語言,同時保持Podcast的聲音。值得注意的是,合成語音有很多有趣的用途,OpenAI可能會成為這一行業的重要組成部分。

圖片功能方面,用戶能向ChatGPT傳送圖片並詢問相關問題,其可以根據圖片回答或給出建議。據悉,語音功能將在iOS和Android平台推出,圖片功能則將登陸所有平台。

例如,用戶可以上傳一張粉色太陽鏡的圖片,並要求聊天機械人推薦與之搭配的服裝;或者拍下雪櫃內部的照片,就可取得餐點食譜建議;又或者提交一張數學問題的圖片,並請求説明解決。

OpenAI在一篇文章中表示:「語音和影像為大家提供更多在生活中使用ChatGPT的方式。在旅行時拍下一張地標的照片,就能即時討論當中有趣的地方。」

根據OpenAI說法,語音和影像功能向ChatGPT Plus和Enterprise用戶推出後,最終會進入蘋果和Google智能手機作業系統。

OpenAI說:「你現在可以使用語音與你的助理進行來回對話。隨時隨地與它交談,為你的家人要求提供一個睡前故事,或解決餐桌上的爭論。」

必看文章

相關文章