## ##

        科大讯飞是如何制定AI战略

        1 課時 時長:13:55

        分享至:
        收藏

              訊飛設計理念是A+i,“A”即“Artificial”,同時字母“A”趨于鉆石的特征,是科大訊飛傳統421克拉價值觀的具象呈現,而“i”作為“訊飛”的首字母,同時又是“intelligence”的縮影。

              在Chat-GPT時代下,人工智能技術對文化創作有著很大的影響。而這次演講,我也將分享訊飛最前沿的技術,AIGC帶來的影響以及訊飛的技術發展:訊飛2030超腦計劃,訊飛聽見會記/會寫影響文字內容創作,虛擬人影響視頻內容生產等。


              IXDC采訪到科大訊飛副總裁王瑋女士,就目前AI行業的發展趨勢和科大訊飛在其中的角色、科大訊飛在人工智能領域的競爭優勢、在過去幾年里科大訊飛重要的技術創新和突破等問題進行詳細的解答。


        20231030162844026.jpg


        請介紹目前AI行業的發展趨勢和科大訊飛在其中的角色

        首先非常高興今天能有這樣的一個交流,我本人不是從事設計專業,作為一個外行來參加今天這個會,我是想因為現在是一個無卡的時代,很多是需要跨界的融合和交流。科大訊飛是一家人工智能公司,1999年成立,是幾位在中科大的學生創業,在2008年的時候在a股進行上市。我剛剛看了一下,今天的市值是1,500億,他現在已經變成了一個全球亞太的這樣的一個人工智能公司,從語音合成到語音識別到機器翻譯到自然語言理解,甚至今年最火的大模型。訊飛是一家技術驅動型的公司,既然今年比較火,那就說說大模型。大模型從去年open ai發布以來,就給大家是帶來技術上的一種顛覆,那么國內現在也是進入一個百模大戰。今年的5月6號科大訊飛正式發布了星火大模型,我們也是從原來人工智能開放平臺上面這樣的400多種的能力,還有應用的開發者中間我們把所有的內容進行了匯聚。現在在文本生成、自然語言理解、邏輯推理、數學推理甚至還有多模態等七項任務中,萃取出了一些應用,在5月6號發布了之后,6月5號又進行了一個進階,馬上8月15號的時候又會發布新的一個大模型的一些應用。大模型來了以后給我們不管是從設計也好、應用也好,都會帶來各種各樣的一些變化,就比如說我現在帶的團隊,叫訊飛聽見大家都看到語音轉成文字,現在大模型來了之后,我們把它再增加上這種語意的理解,文本的順滑還有一些規整。比如說我們今天采訪的聲音,然后它可以形成文字就可以一鍵的進行成稿,把我那種繁文縟節、亂七八糟的話萃取出來。另外的話可以生成會議紀要、工作待辦,甚至還可以寫文案,比如說這個小紅書風格,比如說一些新聞播報風格等等。它就相當于給每個人尤其是文字工作者,增加了一個助手。你看了它之后在它的基礎上再進行修改,就極大的提高了工作的效率。


        請分享您是如何看到科大訊飛在人工智能領域的競爭優勢的

        首先因為我們還是秉持了自己的一些源頭創新,訊飛現在第一個在開放的平臺上,我們大概已經有400多種人工智能的技術,在源頭創新中我們已經大概有四五十項,在國內國際上面都獲得了一些國際性比賽的冠軍。另外的話訊飛現在也是國家認知重點實驗室,還有一些人工智能的實驗室,其實現在已經是在核心的源頭技術上面,訊飛應該是國家隊。那么應該講說技術是一個使能技術,技術也是供給側,它必須要有自己的核心技術之后,才能夠推動一些產品的變革,應用的變革,甚至一些人們生活方式的變革。


        請介紹科大訊飛在人工智能領域的創新能力?在過去的幾年里,科大訊飛有哪些重要的技術創新和突破

        如果我們今天回到技術上來講的話,其實在訊飛的這個里程碑上面是有幾個階段性里程碑的。首先我們是講感知智能,大概在2015年左右,我們的語音識別突破到了一些應用的門檻,我們在2015年12月21號在國家會議中心發布了連續語音轉寫,就是全球首臺的語音轉文字,叫訊飛聽見智能會議系統,這個是邁上一個境界,然后是到2017左右有個認知,我們把這個所有的醫生的醫師資格考試的資料進行了學習,學習了以后訊飛就去參加執業醫師資格的考試,而且還獲得了執業醫師資格,這個就是開始面向認知。后續包括像現在一些大模型的從感知到認知,到自然語言理解等等一系列的這樣的源頭創新。但是光有技術還是不夠的,我們要說用正確的方法做有用的研究,技術最后還是要走向應用、走向落地,賦能到大家的日常的工作生活學習中,我們就把這些的一些技術找到了一些場景,比如現在訊飛在面向教育、面向醫療、面向消費者,面向生活的方方面面,因為我們說人工智能就像水和電一樣的,它可以給你改變很多。現在比如說教育里有沒有,我們在整個K12的這種教育里面,提出了個性化學習,因為它里面用一些知識圖譜,用這樣的一些改進。包括現在訊飛的學習機不用孩子們頻繁的刷題,你只要看一下你自己哪里的知識點掌握的有問題,你就重點的去做那個題目,更個性化的這種教學。比如說我們像現在的一些醫療,我們做一些輔助的這種智醫助理,做一些這種慢病管理,也是極大的提升了社區醫療,甚至一些醫院的輔助診療上都有了很大幫助。還是再說一下消費者,因為這個可能跟設計跟行業相關,本身我自己也是在消費者這個業務集群里面,那么我們這幾年做了很多的一些軟硬件一體化的設備,比如說我們的翻譯機、辦公板、錄音筆,甚至我們的一些智能的麥克風,它通過軟硬件這種結合的方式。就拿我們的錄音筆來講,他原來只是把聲音錄下來,現在不僅錄下來了以后,還能夠后續給你快速的語音轉成文字,一小時的語音大概5分鐘就可以給你出材,出了材之后極大提高采訪和編輯的工作的效率,現在在搭載了大模型了之后還可以給你把文本各方面來進行整理。比如說我們的辦公本,現在在消費類電子上的排名是第一,它是用墨水屏,你可以在上面進行很流暢的書寫,書寫完了以后還能夠把內容進行記錄、分享、存儲,甚至還可以進行閱讀。講到這時候應該就到設計,訊飛專門有一個這樣的硬件的設計的團隊,包括一些工業造型,它最后還是要設計的比較美。我們其實也有一個叫AI人工智能 那在i的上面,我們又把它萃取出來一個跑道員,然后邊上訊飛的價值觀,我們有個叫421克拉,就是要成就員工理想、創造客戶價值。另外還有創新和堅守,下面還有簡單真誠、擔當奮進等,就是一個421克拉像鉆石一樣,我們就把鉆石的元素和這個人工智能的元素,把它進行融合后,可以看到訊飛現在的一些硬件的造型。第一個它是比較高科技,它選的顏色材質各方面都是比較黑科技,另外的話它這個觸感各方面都顯得比較高級一點,大概是有這樣的一個元素理念,再往下講因為我不是設計專業的就不能班門弄斧。


        針對目前市場上存在的一些爭議,如語音合成技術的“假人”問題,您如何看待這些問題?科大訊飛將如何應對這些挑戰

        我覺得你這問題挺好,因為我剛才說用假人,其實我覺得用虛擬數字人或者是用數字孿生這個表達的會更好。其實訊飛最早起家是做語音合成起家的,但是你看像現在,比如說10086甚至一些打電話的訂餐電話或者什么,他都已經使用語音合成技術,包括我們現在的一些導航都是可以給你提高效率。那么再向前走的時候,就開始有多模態,我們就把這個人臉還有包括它一些口唇,這里面有2D的3D的虛擬數字人就起來了。現在正在開大運會,這次我們大運會里面有一個虛擬志愿者叫小福,他現在正在大運村里面工作,他有一個大屏,然后虛擬志愿者在上面,如果說有的一些運動員或者是這個國外的友人過來后,跟那個大屏進行互動,你要到哪怎么樣或者是什么。大概在前天還上了央視的焦點訪談,就是它可以用一種更加科技的手段來去,給你帶來一個全新的感受,你可以跟人機交互,因為人工智能還是讓機器像人一樣,能聽、會說、能理解、會思考,再加上這種多模態的數字孿生,它會變成一種很好的形式和載體。比如說它可以是變成像虛擬的志愿者,它可以變成虛擬的前臺,甚至我們都把它裝在這個手機里面,你可以跟它進行一個虛擬的口語訓練,這樣的一些陪伴。另外的話其實現在有些在直播場景中它也是一種虛擬的孿生,它可以是你的一個助手,然后進入到你生活的方方面面,可以讓我們人能夠騰出時間來去做更多,更有創意的、更有溫度的 或者是其他更需要人的這種去做的這樣工作,其實還是解放生產力。

        0人打賞

        機構簡介

        王瑋

        王瑋

        科大訊飛

        副總裁

        2001年加入科大訊飛,現任科大訊飛消費者事業群副總裁、安徽聽見科技有限公司總經理。王瑋自2001年起,在語音合成、語音識別、語音評測、語音翻譯等相關核心技術研發和產業發方面做出了重大的貢獻,并多次推動和參與國家部委、省市等多個重點項目的建設。

        帶領團隊在語音轉寫核心技術基礎上推出聽見轉寫網站、聽見智能會議系統、智能文稿唱詞系統等系列產品,目前訊飛聽見系列產品已在政府、企業、教學、司法、媒體等各行各業中取得了良好的應用成效。

        這里擁有全球領先的用戶體驗創新知識。全網獨家,更權威,更全面。

        每一年,來自全球領先企業的專家、CEO們都給我們分享最成功的案例、方法與前瞻觀點。幫助數以萬計的從業者們解決產品、設計、運營、技術、管理等5大內容類別的困惑與瓶頸。在這里,你可以觀看500+國際體驗設計大會高清權威視頻課程。

        IXDC帶你建立全球視野與能力,解決專業困惑與職場瓶頸,足不出戶汲取讓你成長的海量知識。聯系在線客服:18826260168

        聯系客服

        故障反饋