蓋世汽車(chē)訊 據(jù)外媒報(bào)道,OpenAI宣布推出新的旗艦生成式AI模型GPT-4o(“o”代表“omni”,即該模型處理文本、語(yǔ)音和視頻的能力)。根據(jù)演示視頻,它可以與用戶(hù)進(jìn)行近乎實(shí)時(shí)的語(yǔ)音對(duì)話(huà),表現(xiàn)出類(lèi)人的性格和行為。
(圖片來(lái)源:OpenAI)
GPT-4o提供“GPT-4級(jí)別”智能,但速度更快,并改進(jìn)了GPT-4跨多種模式和媒體的能力。OpenAI首席技術(shù)官M(fèi)ira Murati表示:“GPT-4o可以跨語(yǔ)音、文本和視覺(jué)進(jìn)行推理。這非常重要,因?yàn)槲覀冋谘芯咳祟?lèi)與機(jī)器交互的未來(lái)?!?/p>
GPT-4o極大地改善了OpenAI的人工智能聊天機(jī)器人ChatGPT的體驗(yàn)。該平臺(tái)長(zhǎng)期以來(lái)一直提供語(yǔ)音模式,使用文本轉(zhuǎn)語(yǔ)音模型轉(zhuǎn)錄聊天機(jī)器人的響應(yīng),但GPT-4o對(duì)此進(jìn)行了增強(qiáng),讓用戶(hù)與更像助手一樣的ChatGPT進(jìn)行交互。
例如,用戶(hù)可以向GPT-4o支持的ChatGPT進(jìn)行提問(wèn),并在ChatGPT回答時(shí)打斷它。OpenAI 表示,該模型提供“實(shí)時(shí)”響應(yīng)能力,甚至可以識(shí)別用戶(hù)聲音中的細(xì)微差別,從而生成“一系列不同情感風(fēng)格(包括唱歌)”的聲音。
GPT-4o還升級(jí)了ChatGPT的視覺(jué)能力?,F(xiàn)在,向它展示一張照片或桌面屏幕,ChatGPT可以快速回答相關(guān)問(wèn)題,主題范圍包括“這段軟件代碼中發(fā)生了什么?”到“這個(gè)人穿什么牌子的襯衫?”Murati表示,這些功能未來(lái)將得到進(jìn)一步發(fā)展。目前,GPT-4o可以查看不同語(yǔ)言的菜單圖片并進(jìn)行翻譯。舉例來(lái)說(shuō),未來(lái)該模型可以支持ChatGPT“觀看”現(xiàn)場(chǎng)體育比賽,并向用戶(hù)解釋規(guī)則。
Murati表示:“這些模型變得越來(lái)越復(fù)雜,但我們希望實(shí)際交互體驗(yàn)變得更自然、輕松,并且客戶(hù)無(wú)需關(guān)注用戶(hù)界面,而只關(guān)注與ChatGPT的協(xié)作。在過(guò)去幾年里,我們一直非常專(zhuān)注于提高這些模型的智能,這是我們第一次在易用性方面真正邁出一大步?!?/p>
為了使先進(jìn)的人工智能在全球范圍內(nèi)更易于獲得和使用,GPT-4o的語(yǔ)言功能在質(zhì)量和速度方面得到了提高。現(xiàn)在,ChatGPT支持50多種語(yǔ)言(在新窗口中打開(kāi)),包括注冊(cè)、登錄和用戶(hù)設(shè)置等。
OpenAI計(jì)劃在未來(lái)幾周內(nèi)首先向“一小群值得信賴(lài)的合作伙伴”提供GPT-4o新音頻功能支持。
來(lái)源:第一電動(dòng)網(wǎng)
作者:蓋世汽車(chē)
本文地址:http://www.cbbreul.com/news/shichang/231480
以上內(nèi)容轉(zhuǎn)載自蓋世汽車(chē),目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.cbbreul.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。