近日,佳都科技憑借著領先的視覺深度學習技術,在計算機視覺識別領域的頂級賽事WebVision競賽中位列前五,躋身國際第一陣營。
據了解,WebVision競賽是2017年成立的新的大規模圖像識別任務權威挑戰賽事,由CVPR(IEEE Conference on Computer Vision and Pattern Recognition的縮寫,即IEEE國際計算機視覺與模式識別會議)組織、Google協辦。Webvision 2019數據集包括5000類,1600萬張圖片,數據量龐大,訓練識別難度大幅增加。今年共吸引到全球154只參賽隊伍參賽,涵蓋眾多頂尖科技公司和知名高校,佳都科技以77.92的優異成績入選前五,僅次于阿里、商湯、華為、百度。
圖片來源:WebVision 官網
人工智能“世界杯”, WebVision逐步接棒
人工智能由“深度學習”技術所驅動,盡管目前看來,深度學習技術表現非常出色,但其需要大量的標注數據來支持。多年來,ImageNet數據集已被視為評估大規模計算機視覺算法的基準,ImageNet的數據集是人工標注和平衡的干凈數據,但其花費的人力成本是巨大的:通過近五萬人,耗時兩年多時間,標注數百萬張圖片數據。
而WebVision用于計算機的訓練數據都是從互聯網通過以詞搜圖的搜索引擎爬取,并未經過人工標注或篩選,數據包含大量噪聲——圖片與其標簽或類別不符的“臟”數據,且不同類別之間的數據量差異之大可達三十倍。這極大增加了使用深度學習算法訓練模型的難度,對深度學習算法的提升有更大的幫助,卻更加貼近于實際應用。商業、金融、醫療等領域擁有海量但缺乏專業人士標注或標注不統一的數據,對人工智能技術的落地尤為關鍵。
“非人工標注”數據的獲取成本要低很多,可是對深度學習算法的要求卻非常高,傳統的“有監督”學習已經不適用,而半監督學習(Semi-Supervised Learning)則成為主流。ImageNet的既定數據庫已經很難使深度學習算法獲得突破性進展,因此,人工智能“世界杯”ImageNet挑戰賽退役,由WebVision接棒。圖像識別比賽不再停留在處理“實驗室”干凈樣本數據中,而是開始挑戰極度不平衡且有噪聲的互聯網圖像識別,真正走向實際應用場景。
本次競賽,佳都科技采用類半監督學習方式,利用噪聲數據直接訓練粗模型,基于粗模型對訓練數據分配權重,再利用加權的數據訓練精模型,逐步引入噪聲提升模型的泛化性。訓練模型采用數據融合、標簽平滑、零gamma初始化、混合訓練等策略提升訓練精度,并且,采用殘差網絡及其變種作為基線網絡。
具有佳都特色的“自主研發+協同創新”的研發體系,正在發揮威力
佳都科技是專業的人工智能企業,專注于計算機視覺領域,人臉識別靜態識別率高達99.9%。實際商業應用才是圖像識別技術商業化落地的關鍵,佳都科技人臉識別技術已形成一系列產品和解決方案,落地于軌道交通、公共安全、城市交通、A.I.創新應用多個航道,實現A.I.與主賽道業務的深度融合。
一直以來,佳都科技堅持“技術立身”的發展理念,聚焦計算機視覺、智能大數據等人工智能細分技術領域。目前,公司已經建立多個高水平的智能化技術研發機構,包括全球智能技術研究院、國家級企業技術中心以及多個省、市級技術中心,聯合建設了物聯網芯片與系統應用技術國家地方聯合工程實驗室、城市軌道交通系統安全與運維保障國家工程實驗室等,并引進新加坡國家工程院院士李德纮等國際領軍人才以及多名計算機視覺、智能大數據方面的技術專家。與此同時,公司在強化自主研發的基礎上,靈活通過參控股和合作的方式進行研發,建立具有佳都特色的“自主研發+協同創新”的研發體系。近年來,公司陸續參股云從科技、千視通科技、佳都數據、睿帆科技等一批人工智能技術企業,并與中國科學院、清華大學、中山大學、西南交通大學、華南理工大學等知名院校建立專項技術研發合作,逐步形成技術生態圈。
2018年,佳都科技獲得國家企業技術中心認定
佳都科技視覺深度學習技術在WebVision競賽中獲得前五,意味著公司在計算機視覺領域將實現新的突破,為視覺技術的提升以及智能交通、智慧城市等領域的深度應用打下扎實技術基礎。未來,佳都科技將持續在人工智能科學技術研究領域加大投入,不斷推進深度學習的技術突破和商業應用。
Thank you for your message. We will contact you for the first time.