谷歌表示,其研發的一款人工智能系統,能夠幫助視障人士獨立參加跑步比賽。據悉,依靠該系統,視障人士不需要依靠人類向導或導盲犬自己便可以跑完全程。那么,這款人工智能系統如何讓視障人士參加跑步比賽?近年來在幫助視障人士恢復視力等方面,人工智能有哪些階段性成果?目前這些產品距離應用還有多遠?
現在很多崇尚健身的人喜歡挑戰馬拉松,而盲人如何參與跑完“半馬”或“全馬”呢?一位公益組織人員介紹,盲人要參加此類比賽,需陪跑者的幫助。為了方便跑步,盲人和陪跑者之間有1條牽引繩,分別套在各自的手腕上,如同牽手跑步。為了確保盲人在跑步中萬無一失,有時需要兩位陪跑者。但是,盲人平時訓練時,隨時找個陪跑者似乎不太現實。
谷歌開發的這套系統似乎讓我們看到了希望。這個系統,不需要讓視障人士依靠人類向導或導盲犬即可自己跑完全程。據介紹,這個應用程序使用人工智能模型來識別道路上的一條畫線,并推斷出跑步者與這條線的關系。如果跑步者離線太遠,該應用程序就會向他們佩戴的骨導耳機發送信號,播放令人不快的噪音。聲音是哪只耳機發出的、音量有多大,都能讓跑步者知道他們需要移動的方向及其離終點有多遠。
使用谷歌的這個系統,跑步者需要把一部安卓手機與經設計的腰帶綁在腰上。這款應用程序不需要連接互聯網即可工作,而且還可考慮多種光照和天氣條件。顯然,若在一些社區,專門為視障人士建立帶有指引標志的賽道,他們自己便可以安心愉快地奔跑健身。
如今,許多互聯網公司都通過各種方式成功讓視障人士與他們提供的服務實現互動,主要方法就是將文本轉變成由屏幕閱讀器發出的語音。4年前,臉譜公司(Facebook)發起“無障礙倡議”,嘗試采用人工智能技術來豐富盲人、聾人和其他殘疾人士的用戶體驗,重點工作之一是重新設計菜單和按鈕結構,運用自動口譯某些照片和視頻的算法使其能為屏幕閱讀器所用,為視障用戶提供豐富的場景描述。
瑞士eyra公司專門為視障人士研發了一種助讀設備。據介紹,這個裝置由三部分組成:掛在耳朵上面的骨傳導耳機及其上面的高清攝像頭,還有AI處理器。AI處理器可以將文本轉化成有聲小說,當然也不用擔心噪音干擾的問題,因為是骨傳導,可以一定程度上減少噪音干擾,給視障人士的生活帶來便利。
今年在拉斯維加斯舉辦的世界最大消費類電子產品展會上,一款智能手機可以通過語音講述周圍的世界,賦予視障人士和弱視用戶更豐富的視覺體驗。該應用還可適配智能眼鏡,可將用戶的智能手機攝像頭變成用戶的眼睛。據介紹,其利用人工智能識別攝像頭指向的視覺信息,包括食品包裝、海報和顯示屏,比如超市的商品信息、車站的顯示投屏、街邊的海報。此外,還可以識別記錄親朋好友的面孔,用戶可以用其掃描和尋找周圍的人和事。
目前,很多專為視障人士設計的解決方案,正凸顯著人工智能應用的多樣化和人性化。那么,如何加速人工智能產品的突破性運用,讓冰冷科技釋放出人文關懷?
首先要培育創新生態。在2017年德勤全國創新精英挑戰賽總決賽上,一支四川大學在校學生團隊研發的一款視障人士Kindle閱讀器獲獎。我們應該激勵更多像這樣為視障人士創新的技術成果,不讓其沉睡,盡早轉化成真正讓視障人士受益的產品,這就需要構建一個良好的創新生態。
此外,要解決算力和成本之間的矛盾。機器學習訓練往往要消耗大量的算力,操作中會出現時間上的延遲與信息隱私的安全隱患,這就要將AI算法中的數據上傳到云端完成。而要滿足終端AI推理運算的實時、可用性需求,就要在本地處理大量的數據,但若在終端本身部署高性能的AI芯片,從成本控制上來看不大現實,在實體場景中部署足夠多的邊緣AI更具一定可行性。
邊緣計算可看作是5G+AI+云計算的輔助――“神經末梢”。比如AI導盲杖要實現實時交互與判斷,看到紅綠燈變綠,能夠自動判斷出“可通行”的狀態。運用邊緣計算就不必將路燈信息上傳到云端,經云
服務器層層判斷才發出行走的提醒。這無疑大大減少延遲帶來的行進風險,也降低云端計算的超負荷。
最后,還需要等待產業環境的全面成熟:基礎設施的完善,軟硬件基本到位,這樣可在終端設備上更好運行深度學習算法。
資料來源:科技日報