亚洲av日韩综合一区二区三区 _亚洲福利一区二区_精品国产一区二区三区不卡在线 _日韩精品一区二区三区视频

不信謠不傳謠 講文明樹新風 網絡安全
首頁 經濟 通信科技

數據挖掘大戰 機器怎么做到“見信如面”

2018-04-09 15:39 來源: 科技日報 責任編輯:fl
發送短信 zmdsjb 10658300 即可訂閱《駐馬店手機報》,每天1毛錢,無GPRS流量費。

摘要:原標題:數據挖掘大戰 機器怎么做到“見信如面”大數據殺熟?隱私換便捷?一度被熱捧的大數據挖掘,近日站在了輿論的風口浪尖:一些商家利用大數據挖掘技術&ldqu

原標題:數據挖掘大戰 機器怎么做到“見信如面”

大數據殺熟?隱私換便捷?一度被熱捧的大數據挖掘,近日站在了輿論的風口浪尖:一些商家利用大數據挖掘技術“殺熟”被網友親測證實;百度董事長兼CEO李彥宏一句“中國人對隱私問題沒有那么敏感”,更是讓它的處境雪上加霜。大數據挖掘技術就像一位有了負面新聞的明星,霎時間光彩暗淡,似乎變成了偷人隱私的小賊。

《大數據時代》一書暢銷之后的幾年,大數據雖不再那么當紅,但并未隱退,它的持續發展已成為人工智能得以實現的基礎之一。

那么,大數據挖掘究竟是怎樣的技術?從誕生發展至今,那些埋頭苦干的技術人員又讓它長了哪些本領?面對大數據難以管理的問題,有沒有技術手段加以控制?

用戶畫像:機器給人類貼標簽

“通過打標簽的方式建立用戶畫像,是數據挖掘常用的一種技術。”北京大學計算機科學技術研究所多媒體信息處理研究室主任彭宇新教授解釋,建立用戶畫像就是利用社交網絡的信息,根據用戶社會屬性、生活習慣和消費行為等信息,抽象出一個標簽化的用戶模型,目標是使機器實現類似于人的“見信如面”的能力。社交網絡數據是實現這一目標的基礎,機器對人的“初相見”多是源自于對社交網絡數據的挖掘。

標簽,通常是通過對用戶信息進行分析得到的高度精煉的特征標識,使得機器方便做信息提取、聚合分析等處理。標簽本身無需再做過多文本分析等處理工作,這為利用機器提取標準化信息提供了便利。

“有了標簽,計算機就能夠自動處理與人相關的信息,能夠通過算法、模型逐步‘理解’ 人。”彭宇新介紹,多個標簽共同完成畫像,整個過程可分三步走:一是采集數據,即基于文本的信息抓取,口語稱為“爬數據”;二是用戶行為建模,通過機器學習技術,形成算法模型,判斷用戶可能的一些行為;三是可視化展現,把機器運算出來的結果,通過能讓人類理解的方式展現出來。這三步是多輪調整的,在實際應用中,根據結果的反饋,以及業務需求,可能進行二次建模等調整。

整個過程的影響參數是相對多元的,不同的行為類型,對于標簽信息的權重影響也不同。以應用最廣的商品營銷為例,比如網售紅酒,如果“購買”權重計為5,僅“瀏覽”計為1,加上瀏覽間隔、駐留時長、生活習慣等,通過復雜的算法最終呈現出一個標簽的權重,再形成畫像。

基于用戶畫像技術,大數據挖掘進行分類和關聯規則計算等分析:例如喜歡紅酒的用戶有多少,喜歡紅酒的人群中,男、女比例是多少,喜歡紅酒的人通常喜歡什么運動品牌等等。

跨媒體智能識別:為計算機裝上慧眼

“以前文本信息占主流,現在圖像、視頻等多媒體數據鋪天蓋地而來。”彭宇新說,后者目前占據大數據的80%以上。

數據類型發生的巨大變化,使得智能識別的任務更加艱巨。“管不住”和“用不好”的問題日益凸顯。“機器只能讀懂自己的語言。”彭宇新說,人類世界的所有語言都要轉化為機器理解的語言才能被識別,以前只處理文本相對簡單,而現在要加上復雜的圖像、視頻等數據。

“例如,世界上有數千種鳥類,很多種的差異非常細微,即使是有專業知識的人類也很難準確辨認,計算機自動識別的難度就更大了。”彭宇新說,圖像、視頻內容理解的難點在于如何進行語義自動識別,這也是他們團隊多年攻關的課題之一,為此團隊發明了基于注意力模型和深度增量學習的識別方法。

注意力模型,顧名思義是讓計算機自動定位圖像的顯著性區域,以此提高檢測精度;深度增量學習,是指計算機能夠利用已經學到的知識加速對新知識的學習,同時通過動態擴容以支持新概念的檢測。

新模型新算法的發力,幫助機器快速識別圖像、視頻的語義信息。彭宇新團隊近年來六次參加國際權威評測TRECVID的視頻樣例搜索比賽均獲第一名,并在與卡內基梅隆大學、牛津大學、IBM Watson研究中心等參賽隊伍的較量中勝出。其中一個題目就是在464個小時的視頻中快速準確地找出所有的倫敦地鐵標志,彭宇新團隊僅用了不到1秒就成功勝出,獲得第一名。

單媒體信息的分析與識別之上,如何進一步讓機器像人類一樣能看、能理解呢?

為達到跨媒體信息融合與一體化分析識別的目的,項目團隊首先把數據按照不同媒體類型自動分發到對應的分析與識別模塊。例如,對視頻鏡頭進行分割、對關鍵幀進行提取,然后分發到鏡頭檢索、片斷檢索、視頻字幕識別等模塊中,對單媒體分析結果進行跨媒體語義關聯分析,實現跨媒體信息的語義協同。“一種常用的方法是構建第三方空間進行跨媒體關聯。”彭宇新說,“計算機根據我們教它的模型分別為圖像、視頻、文本、音頻抽取表征,再共同投射到一個第三方空間中,這樣不同媒體的信息就可以對話了。”

技術的“抽絲剝繭”,讓圖像、視頻中的信息可以如文本一般精確透明。“我們是瞄著應用去的,準確率、處理速度都經過多年的優化,已經可以進行實際應用了。”彭宇新介紹,這項技術不僅幫助新聞媒體等行業進行數據管理和檢索,還在助力互聯網管理部門對大數據進行分析與監測。

延伸閱讀

匿名處理:可預期的隱私保護對策

打破信息控制權幾乎不可能,但隱私保護卻有個很便捷的方法。北京郵電大學教授楊義先的《安全簡史》中有個形象的比喻,如果數據在網上“裸奔”,為了不被溯源,最便捷的安全手段是“把臉捂住”。這就是所謂的“匿名化處理機制”。

“用戶隱私保護的相關規定要求,數據公司在售賣數據時,需要對數據進行匿名化處理。”北京大學計算機科學技術研究所研究員趙東巖說。但為了精準定位、推送服務,匿名化處理可能被忽視。“精準意味著目標客戶群的ID指向,而不是向群體發送,因此,個性化推送和匿名化處理在目前的技術中是相互沖突的。”

針對上面的沖突,業界的先行者提出一種區塊鏈的解決思路。“我稱它為OF ID。”北京領主科技公司研究人員劉偉泰說,“大數據的本質是群體研究,但是群體粒度可以細一些,此外,區塊鏈技術可以授予用戶授權的方法。”

不難想象,隨著新技術的不斷創新,會有更多用于信息安全的技術突破,不是一門心思用于大數據挖掘,而是也能用于制衡“信息控制權”。

 

責任編輯:fl

(原標題:科技日報)

查看心情排行你看到此篇文章的感受是:


  • 點贊

  • 高興

  • 羨慕

  • 憤怒

  • 震驚

  • 難過

  • 流淚

  • 無奈

  • 槍稿

  • 標題黨

版權聲明:

1.凡本網注明“來源:駐馬店網”的所有作品,均為本網合法擁有版權或有權使用的作品,未經本網書面授權不得轉載、摘編或利用其他方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:駐馬店網”。任何組織、平臺和個人,不得侵犯本網應有權益,否則,一經發現,本網將授權常年法律顧問予以追究侵權者的法律責任。

駐馬店日報報業集團法律顧問單位:上海市匯業(武漢)律師事務所

首席法律顧問:馮程斌律師

2.凡本網注明“來源:XXX(非駐馬店網)”的作品,均轉載自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如其他個人、媒體、網站、團體從本網下載使用,必須保留本網站注明的“稿件來源”,并自負相關法律責任,否則本網將追究其相關法律責任。

3.如果您發現本網站上有侵犯您的知識產權的作品,請與我們取得聯系,我們會及時修改或刪除。

返回首頁
相關新聞
返回頂部
亚洲av日韩综合一区二区三区 _亚洲福利一区二区_精品国产一区二区三区不卡在线 _日韩精品一区二区三区视频

              亚洲一区日韩在线| 香蕉久久夜色精品国产| 黑丝一区二区| 欧美一区视频在线| 欧美日本高清| 激情综合五月天| 久久在线播放| 国产精品每日更新在线播放网址| 亚洲图片你懂的| 免费在线观看日韩欧美| 国产午夜精品久久久久久免费视 | 亚洲天堂黄色| 麻豆国产va免费精品高清在线| 国产精品第一页第二页第三页| 亚洲午夜久久久久久久久电影网| 久久综合色88| 国产日韩一区二区| 欧美亚洲三级| 欧美午夜一区二区福利视频| 亚洲永久精品大片| 欧美精品一区二区精品网| 国产一区自拍视频| 久久综合亚洲社区| 国产在线不卡视频| 免费在线成人av| 精品成人久久| 欧美精品三级日韩久久| 在线观看一区视频| 欧美激情第4页| 激情综合色综合久久| 欧美成人一二三| 精品成人乱色一区二区| 欧美国产欧美亚州国产日韩mv天天看完整| 国产在线视频欧美一区二区三区| 久久综合中文色婷婷| 国内精品久久久| 欧美成人综合一区| 亚洲一区二区免费看| 欧美视频中文字幕| 欧美一区二区三区精品| 国产精品一区二区三区久久久 | 国产精品国产a级| 小黄鸭精品aⅴ导航网站入口 | 欧美日韩综合另类| 午夜国产精品视频| 国产精品久久久久久亚洲毛片| 久久aⅴ国产欧美74aaa| 国产酒店精品激情| 麻豆国产精品va在线观看不卡| 激情久久一区| 欧美精品日韩精品| 午夜日韩视频| 国产日韩欧美综合一区| 免费高清在线一区| 亚洲网站在线播放| 国产精品高潮呻吟久久av黑人| 久久精品日产第一区二区三区| 国产午夜精品视频| 欧美国产91| 欧美一区二区播放| 国产性做久久久久久| 欧美高清在线视频观看不卡| 亚洲欧美视频| 国产在线不卡视频| 欧美日韩三区四区| 久久香蕉国产线看观看网| 1024日韩| 国产欧美精品日韩| 欧美精品1区2区| 欧美一区深夜视频| 精品999成人| 国产精品卡一卡二卡三| 欧美成人国产va精品日本一级| 亚洲在线网站| 国模吧视频一区| 欧美视频一区二区三区在线观看| 久久免费黄色| 午夜精品久久久久久99热软件 | 久久久伊人欧美| 亚洲丝袜av一区| 国产亚洲高清视频| 欧美性猛交xxxx乱大交退制版| 久久免费视频在线| 午夜欧美大片免费观看| 一区二区三区在线观看国产| 国产精品嫩草影院av蜜臀| 免费观看成人| 久久高清福利视频| 亚洲一区综合| 韩国精品主播一区二区在线观看| 国产精品白丝av嫩草影院| 欧美1级日本1级| 久久精品亚洲精品| 亚洲免费婷婷| 在线免费观看欧美| 国内精品视频在线观看| 国产美女诱惑一区二区| 欧美日韩一区二区三区| 欧美成人一区二区三区| 久久久国产精品一区二区中文| 亚洲在线免费| 亚洲午夜精品一区二区| 怡红院精品视频| 韩国福利一区| 国产亚洲精品资源在线26u| 国产精品久久久久久一区二区三区| 欧美日韩1区2区| 欧美丰满高潮xxxx喷水动漫| 久久久蜜桃精品| 久久国产精品99精品国产| 午夜精品福利视频| 亚洲尤物在线视频观看| 中日韩高清电影网| 在线播放亚洲一区| 国产午夜精品一区二区三区欧美| 国产精品人成在线观看免费 | 欧美一区二区三区视频在线| 亚洲伊人一本大道中文字幕| 在线观看三级视频欧美| 黄色成人在线观看| 精品不卡一区| 黄色精品一二区| 黄色精品一区| 在线免费观看日韩欧美| 黄色欧美成人| 在线欧美亚洲| 亚洲一区二区在线免费观看| 亚洲无限av看| 亚洲影院免费| 性欧美xxxx大乳国产app| 性伦欧美刺激片在线观看| 欧美尤物一区| 久久精品国产一区二区三区免费看| 欧美一区二区在线| 久久精品成人| 开元免费观看欧美电视剧网站| 美日韩精品视频免费看| 欧美本精品男人aⅴ天堂| 欧美国产91| 欧美三级小说| 国产精品专区h在线观看| 国产视频一区在线观看一区免费| 国产亚洲欧美激情| 精品99视频| 亚洲免费婷婷| 久久精品亚洲热| 蜜桃精品一区二区三区| 欧美国产精品专区| 欧美午夜寂寞影院| 国产日本欧美一区二区三区在线 | 国产专区欧美精品| 在线观看日韩www视频免费 | 欧美成人免费在线观看| 欧美精品久久久久久久久老牛影院 | 在线看成人片| 亚洲欧美综合v| 久久久亚洲国产天美传媒修理工 | 久久网站免费| 欧美成人一区二区| 欧美体内谢she精2性欧美| 国产精品外国| 黄色亚洲在线| 亚洲欧美日韩成人高清在线一区| 久久精品一区四区| 欧美精品导航| 国产精品入口麻豆原神| 精品动漫3d一区二区三区| 午夜在线视频一区二区区别| 久久久久久久久综合| 欧美精品久久99| 国产欧美视频一区二区| 亚洲一区二区3| 久久久精品动漫| 欧美日韩激情小视频| 国产区二精品视| 亚洲一区二区高清| 久久综合给合久久狠狠色| 欧美日韩精品一区| 韩国女主播一区| 性做久久久久久免费观看欧美| 噜噜噜噜噜久久久久久91| 欧美色综合天天久久综合精品| 国产亚洲精品成人av久久ww| 亚洲欧美激情一区| 麻豆精品精华液| 国产精品国内视频| 亚洲视频999| 久久久久久穴| 欧美亚日韩国产aⅴ精品中极品| 一区二区在线看| 久久精品天堂| 欧美午夜大胆人体| 亚洲视频一区二区在线观看| 久久三级视频| 国产精品日韩在线观看| 亚洲欧美在线观看| 欧美另类一区二区三区| 韩国av一区二区| 久久综合久久久| 国产精品系列在线播放|