兒童>少婦>老人>狗>男人  嬰幼兒哭鬧怎么辦?寶寶啼哭不止是病了么?嬰幼兒啼哭要不要抱?……這些在搜索引擎、母嬰社區(qū)十分常見問題背后,正是一個明顯的市場需求--父母希望有效發(fā)現(xiàn)嬰 ">

中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當前的位置是:  首頁 > 新聞 > 國內 >
 首頁 > 新聞 > 國內 >

宇音天下:聲聯(lián)網想讓機器聽懂新生兒的語言

--中國每年有1800萬新生兒

2018-01-30 10:07:48   作者:36氪石亞瓊   來源:CTI論壇   評論:0  點擊:


  消費市場價值:少女>兒童>少婦>老人>狗>男人
  嬰幼兒哭鬧怎么辦?寶寶啼哭不止是病了么?嬰幼兒啼哭要不要抱?……這些在搜索引擎、母嬰社區(qū)十分常見問題背后,正是一個明顯的市場需求--父母希望有效發(fā)現(xiàn)嬰幼兒啼哭等聲音,并了解背后的含義,同時獲得相應的應對方法。不過,現(xiàn)實當中,還很難有產品能夠自動化的解決這問題,嬰兒啼哭發(fā)現(xiàn)主要依賴于人工陪護,啼哭的解讀主要依賴于經驗。
  我們近期接觸的初創(chuàng)公司聲聯(lián)網(深圳聲聯(lián)網科技有限公司)則希望利用技術自動解決上述難題,公司主要從事嬰幼童音視頻的行為分析和情感計算,目前已經研發(fā)了基于人工智能技術的嬰幼兒音頻行為監(jiān)護平臺(BabyABAM),通過芯片和云后臺,可以實現(xiàn)實時精確監(jiān)測嬰幼兒發(fā)出的啼哭等聲音,并已經與國內一些合作伙伴達成了合作及合作意向,有望在軟硬件終端產品中迅速落地這一技術。
  嬰兒啼哭的監(jiān)測與識別,在學術界早有研究。隨著人工神經網絡技術的出現(xiàn),也使得準確率進一步提升。近年來,也有一些針對嬰兒啼哭的軟件開始問世,如西班牙的whycry等,此前也有一些攝像頭及音頻類產品,主打嬰幼兒哭聲識別,但在識別的準確性及穩(wěn)定性方面依然不高。
  聲聯(lián)網分析,之所以出現(xiàn)這一現(xiàn)象,有幾方面的原因,一是因為以往的一些方案,主要通過識別環(huán)境音中的異常響聲,只要滿足一定分貝就識別,因此很可能會誤識;二是一般識別過程中會出現(xiàn)成人與嬰幼兒聲音的普遍混音現(xiàn)象,識別難度增加;三是目前市面上還缺少準確有效的嬰幼兒啼哭的高精度的數(shù)據。
  為此,聲聯(lián)網自研了一套算法方案,增加了更多如音高、音強、音色等各種特征維度在內的分析維度,提升識別的準確性。精準標注的訓練數(shù)據是提升識別準確率的一個重要因素。團隊表示,公司用來訓練的嬰兒音頻數(shù)據超過了1000GB,上萬小時的錄音文檔;采用了統(tǒng)計建模和神經網絡建模的算法,目前的錯誤率可以低至5%以內,是國內可量產方案中最低的。
  之所以能做到這一點,是因為聲聯(lián)網已經組建了包括技術、戰(zhàn)略和育嬰方面的頂級專家顧問團隊。公司成立后,獲得了中科院聲學所、東南大學、北京理工大學語音實驗室的大力支持,協(xié)助組建起了技術研發(fā)團隊。首席科學家顏永紅是中科院聲學所研究員、博士生導師、語言聲學與內容理解重點實驗室主任,美國俄勒岡OGI研究院終身教授,2002年入選中科院百人計劃,Intel中國研究中心首任主任。首席戰(zhàn)略顧問倪光南是全國政協(xié)委員、中國工程院院士,聯(lián)想集團創(chuàng)始人、首任總工程師,國家科技重大專項“核高基”相關項目主要負責人。團隊人工智能顧問Bj?rnW。Schuller是德國慕尼黑工業(yè)大學博士,研究領域集中在機器學習、復雜系統(tǒng)、視聽信號處理、人機交互、情感計算等,著有6本專著,在相關國際期刊和會議中發(fā)表過500余篇文章,被引用10000余次,被世界經濟論壇評為40歲以下40位最杰出科學家之一。母嬰領域顧問郭建國則是中華育嬰協(xié)會會長,國內久負盛名的實戰(zhàn)派育嬰專家,人力資源與社會保障部“育嬰師職業(yè)”專家委員會專家,中國兒童基金會教育專家委員會專家,《育嬰師職業(yè)師資培訓教材》主編。
宇音天下:聲聯(lián)網想讓機器聽懂新生兒的語言
  目前,聲聯(lián)網的這一技術,主要通過SDK軟件包或AVS7516音頻識別芯片的方式提供,兩款產品都已經更新至2.0版本,可以對寶寶哭、笑、噴嚏、咳嗽、飽嗝等監(jiān)測和分析,可適用于智能攝像頭、機器人、小夜燈、智能音箱、智能搖籃、智能玩具等產品。產品推廣方面,團隊表示,SDK和芯片樣品已經送至多家知名智能硬件制造商、母嬰用品商、機器人公司進行測試,目前進展順利。
  縱觀國內智能語音市場,除了汽車外,暫時還沒有清晰可見的能有大盈利的市場。聲聯(lián)網分析嬰幼兒市場很可能就是其中的一個。國內每年新生兒數(shù)量即將超過1800萬,全球的數(shù)量則達到1.4億,用戶的數(shù)量基礎龐大。另外,嬰兒父母對于嬰兒用品的態(tài)度是很積極的,購買意愿及付費能力比較強,因此公司對這一市場相對樂觀。
  市場前景樂觀的領域,競爭往往難以避免,這方面聲聯(lián)網的團隊具有一定的先發(fā)資源優(yōu)勢。聲聯(lián)網科技是由國內智能語音合成技術公司北京宇音天下科技有限公司、國內最大的可穿戴方案企業(yè)深圳金康特、新三板上市傳感器芯片公司深圳貝特萊三家公司共同籌資注冊成立,并獲得了中科院聲學所的投資入股。金康特和貝特萊兩家股東方可以提供芯片、方案、客戶、量產等多方面的幫助。
  團隊預計,最近幾年的工作重心都會圍繞嬰幼兒語音做研究,目前已經實現(xiàn)了嬰兒啼哭聲的探測和捕捉,下一步會做持續(xù)的大數(shù)據分析,從而進行背后意義的解讀,即嬰幼兒情感、心理和健康趨勢的解讀。
  目前聲聯(lián)網科技已經組建了25人的團隊?偨浝砗斡钚率侵锌圃河嬎闼┦浚氨本h王公司副總裁,語音合成企業(yè)宇音天下創(chuàng)始人。副總經理肖溪是荷蘭鹿特丹大學碩士,前盈信投資集團助理總裁、前遠古控股集團總經理助理,是精鉆傳媒、遠航縱橫前聯(lián)合創(chuàng)始人。
  此前聲聯(lián)網科技已經獲得來自深圳市高新投集團旗下深圳市人才創(chuàng)新創(chuàng)業(yè)二號股權基金的天使輪融資。
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題