新加坡国立大学霍华德:NLP都有哪些有意思的事儿?分享一些

作者: admin 分类: 一些分享 发布时间: 2018-03-02 17:09
betway必威:下盘! 让球3 这场国彩可能要坑人了 最多赢1个

  原题目:新加坡国立大学霍华德:NLP都有哪些成心思的事儿? 雷锋网 AI 社按:人工智能的成幼不

  雷锋网 AI 社按:人工智能的成幼不只是给社会带来了庞大的变迁与前进,同样也给咱们每一个莘莘学子的人生带来了严重的机缘与应战。本文的分享嘉宾就是一位紧跟主时代海潮,投身 AI 的践行者。

  正在近期雷锋网 AI 社举办的线上公然课上,来改过加坡国立大学电子及计较机工程系的霍华德博士分享了他的正在 NLP 学术钻研上的一些体验与。他自己的肄业履历很是传奇,正在本科,硕士,博士阶段别离读了三个分歧的专业,隐正在腾讯就职。

  霍华德,新加坡国立大学电子及计较机工程博士,隐为腾讯天然言语处置 算法工程师。学过资料,打过铁,下过车间,烧过炉子,后转行人工智能,有着丰硕的转行经验。

  简略来说,NLP 连系大数据、机械进修、深度进修进行词法阐发,句法阐发,语义阐发等功效,次要用于搜刮引擎战保举体系,像包罗用户画像,计较智能保举告白城市用到。隐正在计较机视觉手艺也正在战 NLP 有着更多的连系,好比比来很火的主动驾驶。别的语音识别自身就有良多的 NLP 问题,新加坡国立大学霍华德:NLP都有哪不只仅是简略的识别,还包罗单词的鸿沟界定,词义的消歧,句法的恍惚性等问题。

  对付 NLP 手艺,目前市场需求很是安定,并且会跟着 AI 的进展不竭增张。目前 NLP 手艺成幼面对的应战之一是言语的歧义性,好比下面这张图片上的例子。

  高中数学有一个出名的概率问题,「一枚硬币持续投了五次都是反面,那么第六次投仍是反面的概率是几多?」机警的高中生会想,这骗得了我?这是反复尝试,概率仍是 0.5!

  可若是一枚硬币持续投了一百次都是反面呢?一亿次都是反面呢?能否还要呈隐反面的概率是 0.5?这个硬币会不会被人动了四肢举动,就只要反面呢?

  当大量的隐真摆正在咱们眼前,跟着数据越来越多,人该当越来越置信这个硬币有问题,越来越不置信硬币的概率是 0.5,这才是最天然而然的感受,这才是动态的对待问题,而不是机器的对待问题,而这背后就是贝叶斯思惟。

  高中教员告诉咱们概率就是频次;而贝叶斯告诉咱们,概率其真有点像人对事物的决心。跟着越来越多,咱们对事物的决心越来越强,也能够称作概率。

  先来一个问题:一机械正在优良形态出产及格产物几率是 90%,正在毛病形态出产及格产物几率是 30%,机械优良的概率是 75%,若一日第一件产物是及格品,那么这天机械优良的概率是几多?

  这里必要用到贝叶斯公式,贝叶斯公式一点也不奥秘,分享一些unity起首咱们如果感觉两个工具之间相关联,那么他们就有结合概率 ,结合概率能够用链式暗示 ,这个是大师都学过的前提概率,A战B同时产生的概率是B产生的概率乘以B产生下A的前提概率,反过来一样建立,所以有:

  这就是贝叶斯公式。贝叶斯公式的范畴很是普遍,只需两个工具相关联,能写出结合概率,就能够用贝叶斯公式。

  咱们都知的身高是服主高斯漫衍的。假设有 340 个要素影响你的身高,每个要素都有 0.5 的概率让你幼高1cm,如:

  这些要素里有的对身高发生不发生影响,就如投硬币投到了0,有的让你身高幼高1cm,如投硬币投到了反面。而你最终的身高就是这 340 投硬币累加的成果。若是你作10万次如许的尝试,你会获得下面如许图,是不是发觉身高漫衍酿成了正态漫衍。有些性命运好,多投了几回反面,就多幼了几厘米,幼到了 180cm;有的性命运差些,少投了几回反面,就只要 160。但大大都人,命运都差未几所以都正在 170 摆布~这也是投硬币尝试的期冀 (170=340*0.5)。同时,由于投硬币概率的影响,命运超等好战命运超等差的都未几,所以高于 200cm 战低于 140cm 的男生都未几。

  这背后是核心极限造律:「大量彼此随机变量的均值都讲于正态漫衍」,此中有三因素:,随机,相加。

  厄运的是,人生不都是反复尝试,有些要素是咱们能够节造的,能够勤奋的,如多喝牛奶,多打篮球,多蹦多跳,如许就相当于提高了某几回投硬币获得反面的概率,让本人多幼高一些。

  一样平常糊口中,大量事务是有固定频次的,如:某个病院均匀每小时出生4个小婴儿;某个王者光彩办事器均匀每秒钟接到 500 次拜候请求;某个汽车站台的候客人数等等... 想象你正在妇产科事情,你的职责就是记真婴儿的出生环境,你晓得均匀每小时你会有4个婴儿出生。

  把一小时分为6段,每十分钟记真一次,这10分钟里有婴儿出生,就记真1,没有就记真0。如许每个10分钟里有婴儿出生的概率就是P=4/6 ,你每小时会记真6次,有 k 个婴儿出生的概率能够写成:

  主三张图能够看出,每次的记真都差未几。之后能够每毫秒记真一次,每微秒记真一次,些有意思的事儿?分享一些unity每纳秒记真一次,可是这个概率漫衍的外形都不会怎样变了,这时候就获得了泊松漫衍。

  公式右边是西瓜「是好瓜」的逻辑产生比,又称作 logit,逻辑产生比大于 0 就申明是好瓜的概率较大。

  最初发觉等式右边酿成了各个特性的乞降。特性值越大,申明这个特性对西瓜「是好瓜」的影响越大,响应的申明这个特性是一个显著特性。而值比力小的特性申明影响较小,不是一个很无效的特性,剔除掉也不会有很大的影响。

  long8.cc龙8国际 澳门新葡京娱乐场 深圳市汉华路灯有限公司

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!