當(dāng)前位置: 首頁(yè) > 攻略教程 > 游戲資訊 > GPT-4o正式發(fā)布:免費(fèi)開(kāi)放使用 語(yǔ)音對(duì)話媲美真人

GPT-4o正式發(fā)布:免費(fèi)開(kāi)放使用 語(yǔ)音對(duì)話媲美真人

時(shí)間:2024-05-17 12:32:53 編輯:易網(wǎng)VIP游戲門戶 閱讀:1

在OpenAI的直播活動(dòng)中,OpenAI推出了新的大語(yǔ)言模型GPT-4o。這是其已經(jīng)問(wèn)世一年多的GPT-4模型的更新版本。

該模型基于來(lái)自互聯(lián)網(wǎng)的大量數(shù)據(jù)進(jìn)行訓(xùn)練,更擅長(zhǎng)處理文本和音頻,并且支持50種語(yǔ)言。新模式將面向所有用戶,而不僅僅是付費(fèi)用戶。

此前GPT-3.5語(yǔ)音對(duì)話的平均延遲為2.8秒、GPT-4為5.4秒,音頻在輸入時(shí)還會(huì)由于處理方式丟失大量信息,無(wú)法識(shí)別笑聲、歌唱聲和情感表達(dá)等。

而GPT-4o可以在232毫秒內(nèi)對(duì)音頻輸入做出反應(yīng),甚至還能隨意打斷,與人類在對(duì)話中的反應(yīng)時(shí)間相近,徹底顛覆了以往的“語(yǔ)音助手”。GPT-4o還可以接受文本、音頻和圖像三者組合作為輸入,并生成文本、音頻和圖像的任意組合輸出,人機(jī)交互更加自然、全面了。

GPT-4o的能力還會(huì)向免費(fèi)用戶開(kāi)放,不過(guò)會(huì)限制數(shù)量,免費(fèi)用戶達(dá)到數(shù)量之后,會(huì)自動(dòng)跳回GPT-3.5。GPT-4o還將開(kāi)放相應(yīng)API給GPT的開(kāi)發(fā)者,價(jià)格是GPT-4-turbo的一半,速度卻是GPT-4-turbo的兩倍,速率限制也高5倍。

GPT-4o的發(fā)布勢(shì)將撼動(dòng)快速發(fā)展的人工智能領(lǐng)域,目前GPT-4仍然是黃金標(biāo)準(zhǔn)。OpenAI發(fā)布新模型也正值谷歌I/O開(kāi)發(fā)者大會(huì)的前一天。谷歌是人工智能領(lǐng)域的早期領(lǐng)導(dǎo)者,預(yù)計(jì)將利用這次活動(dòng)發(fā)布更多人工智能更新,以追趕有微軟公司支持的OpenAI。