吴恩达:机器学习的六个架构算法
发布时间:2025年09月04日 12:18
这个原因备有了更加好的答案,而且直觉重返也成为了深度自学的核心。毒物支配:直觉取值可以更早 1830 二十世纪,初期比利时海洋学家 P.F. Verhulst 申请专利它来说明了人均收入动态:随着整整的流逝,指数增宽的初始爆炸流血事件随着它消耗可用人力资源而趋于平缓,从而归因于特点直觉曲面。一个多世纪过往后,宾夕法尼亚州海洋学家 E. B. Wilson 和他的教职员 Jane Worcester 又新设计了直觉重返来推算取值有毒气体有多少是致命的。图注:P.F. Verhulst匹配取值:直觉重返将直觉取值匹配到在线里头集,以便预见取值流血事件(例如,摄入士的宁)发生特定结果(例如,过早致死)的随机性。体能训练准确度相应曲面的里头面心地带一段东北方,垂交相应曲面的里头面有数一段东北方,以最大限度地增大取值负载与在线里头错综复杂的误差。将里头面心地带相应到右方或左侧假定杀死普通人均能够或多或少的毒药。开阔的弯道假定恰当性:在里头面途点以前,大多数人留从前从前;有约一半,「就根本无法话说再见了」(致死的解作)。坡地更加宽容:小于曲面里头面部,一半以上留从前;再往上,只有不到一半的人则会留从前。在一个结果和另一个结果错综复杂设置一个阈数值,比如 0.5,曲面就变成了一个数据集。只均需在建模里头面回传剂量,您就则会知道您应该蓝图布道还是葬礼。更加多结果:Verhulst 的实习见到了二元结果的随机性,显然了全面的意味著性,例如里头面毒受害者意味著则会踏入人世间的哪面对面。他的继任者引入了方法:在 1960 二十世纪后期,爱尔兰海洋学家 David Cox 和法国海洋学家 Henri Theil 分立实习,对带有两种以上意味著结果的持续性顺利顺利进行了直觉重返。全面的实习归因于了也就是说直觉重返,其里头面结果是也就是说数值。为了处理流血事件不规则分布或于其在线里头,直觉重返可以为了让与离散重返不尽相同的同调立体化系统设计。图注:David Cox多机制曲面:直觉取值以相当吻合的方法说明了了尤其的成因,因此直觉重返在许多持续性下备有了有益的较宽预见。在医学上,它可以推估致死率和疾病安全性。在社会学里头面,它预见选举的黑马和输家。在金融学里头面,它预见零售前景。更加极为重要的是,它在各种各样的数论模型平台里头面驱动一部分大脑(其里头面非离散是 Sigmoid 取值)。3发散增高:一切都在急弯想象一下黄昏后在山里头面骑车,见到边上什么都看不到。而且您的握机电池没电了,因此您未应用要用 GPS API看到回来的路。您意味著则会通过发散增高看到最慢的梯度。小心不该从山丘上跟着。有点阳和面料:发散增高比通过开阔的地形增高更加有利。1847年,法国核物理学家Augustin-Louis Cauchy申请专利了近似恒星近地点的方法。60 年后,他的奋起 Jacques Hadamard 分立开发了它来说明了薄而轻松的星体(如面料)的碎裂,这意味著则会使右脚向右徒步更加不易。然而,在数据处理流血事件里头面,它最近似于的用途是看到自学方法损失惨重取值的最低点。图注:Augustin-Louis Cauchy向右爬到:经过体能训练的数论模型平台备有了一个取值,该取值在取值回传的持续性下推算所均需的负载。体能训练门户网站络平台的一种新方法是通过插值推算具体负载与盼望负载错综复杂的相异,然后更加改门户网站络平台的关键点以缩小相异,从而将负载里头面的损失惨重或误差大于立体化。发散增高缩小了相异,将推算损失惨重的取值大于立体化。门户网站络平台的关键点差不多地形上的一个一段东北方,损失惨重的是局限性准确度。随着你的增高,你可以提高门户网站络平台推算吻合所均需负载的能够。可见性是极少的,因为在典型的统筹自学持续性下,该方法仅依赖于门户网站络平台的关键点和损失惨重取值的发散或曲率半径——即你在山里头面的一段东北方和你边上的曲率半径。也就是说新方法是向地形增高最陡的梯度移动。诀窍是校准你的步幅。步幅有点小,就均能够很久整整才能取得令人满意;步幅有点大,你就则会跳入未确定的应用领域,意味著是弯道而不是急弯。取值局限性一段东北方,方法通过推算损失惨重取值的发散来推估最慢增高的梯度。发散指向弯道,那么该方法就是通过减去发散的一小部分来以相反的梯度挺进。援引要用自学率的最高分 α 立即了旋即测量发散以前的步宽。重复要用这几个工序,努力你能进发一个山沟。恭喜!卡在山沟里头:有点可悲了,你的握机没电了,因为方法意味著很难把你推到尾端山的下部。你意味著则会陷入由多个山沟(渐进大于数值)、山峰(渐进最大数值)、鞍点(鞍点)和高原小组成的非楔形景观里头面。事实上,位图鉴别、文档功用要用和口语鉴别等勤务都是非尾端的,并且仍然注意到了发散增高的许多变体来处理流血事件这种持续性。例如,该方法意味著带有试图它可视小幅飙升和下跌的波函数,从而使其更加有意味著进发下部。分析技术人员新设计了如此多的变体,以至于样子优立体化探头的总数与渐进大于数值一样多。恰巧的是,渐进大于数值和有序大于数值常常大致等同于。给定优立体化探头:发散增高是四处寻找任一取值的大于数值的明确考虑到。在可以交接推算粗略解的持续性下——例如,带有大量表达式的离散重返勤务里头面——它可以逼近一个数值,而且有时候速度更加快、成本更加低。但它确实在繁复的非离散勤务里头面发挥了功用。凭借发散增高和冒险意识,你意味著可以马上赶出山区吃晚饭。4数论模型平台:四处寻找取值让我们可先把这个原因弄清楚:神经不是一个位图指令集集,如果它是的话,那它开始运行的应用软件要比典型的博弈论繁复得多。而数论模型平台的隐喻来自神经的形态:一层层连结起来的大脑,每个大脑根据其紧靠状态来推算自己的负载,由此归因于的接连不断活动形成了一个或许——或鉴别出一张狗的相片。从人类到人工:神经通过大脑错综复杂相互功用来自学的或许可以更早 1873 年,但交到 1943 年,宾夕法尼亚州神经生物学家 Warren McCulloch 和 Walter Pitts 才为了让比较简单的数论规则创建了人类数论模型平台建模。1958 年,宾夕法尼亚州心理学Frank Rosenblatt开发出遮罩——这是一种在打卡机上假定的单层视觉门户网站络平台,旨在为宾夕法尼亚州海军陆战队创建一个硬件版本。图注:Frank Rosenblatt越大越好:Rosenblatt 的申请专利根本无法鉴别分段假设。在此之后,乌克兰核物理学家 Alexey Ivakhnenko 和 Valentin Lapa 通过在可任意每层里头面堆叠大脑门户网站络平台,克服了这一容许。1985 年,分立实习的法国推算机生物学家 Yann LeCun、David Parker 和宾夕法尼亚州心理学 David Rumelhart 及其同僚,说明了了应用要用径向传递来有效体能训练此类门户网站络平台。在新千年的第一个十年里头面,最主要 Kumar Chellapilla、Dave Steinkraus 和 Rajat Raina(与吴恩达共同)在内的分析技术人员通过应用要用位图指令集全面推动了数论模型平台的发展,这使得愈发大的数论模型平台能从互联门户网站功用要用的海量在线里头里头面获得自学。适宜都将勤务:数论模型平台背后的理论很比较简单:对于任何勤务,都有一个可分派它的取值。一个数论模型平台通过小组合成多个比较简单取值看成可体能训练取值,每个取值由单个大脑分派。一个大脑的机制由援引要用「最小值」的可调参数立即。取值这些最小值和回传下例及其所均需负载的随机数值,就可以重复更加改最小值,交到可体能训练的取值能顺利进行握头的勤务。一个大脑可接受各种回传(例如,都是像素或单词的大写字母,或前一层的负载),将它们与最小值相乘,乘积相加,并得出由开发工具考虑到的非离散取值或酪氨酸取值的也就是说。其有数要考虑到到它是离散重返、加上一个酪氨酸取值。体能训练删减最小值。对于每个下例回传,门户网站络平台则会推算一个负载并将其与意味著负载顺利顺利进行比较。径向传递可通过发散增高来改变最小值,以增大具体负载和意味著负载有数的相异。人均收入为120人必要多(好的)例叔父重复这个现实生活必要多次,门户网站络平台就能学则会分派这个勤务。黑匣叔父:虽然运气好的话,一母体能经验丰富的门户网站络平台可以顺利进行它的勤务,但最后你要学习者一个取值,常常则会比较繁复——看成数千个表达式和嵌套的酪氨酸取值——以至于推论门户网站络平台是如何获得成功顺利进行其勤务也是比较难于的。此外, 一母体能经验丰富的门户网站络平台只和它钻研的在线里头一样好。例如,如果在线里头集有错误,那么门户网站络平台的负载也则会注意到错误。如果它只看成狗的高分辨率照片,那它对低分辨率照片的反应就众话说纷纭了。一个主旨:在刊文 Rosenblatt 于1958年申请专利的遮罩时,《纽约时报》开拓了计算机科学曝光的高架桥,刊文里头面提到“宾夕法尼亚州海军陆战队盼望拥有一台则会动手、话说话、看、写、自我复制和发现自己自己假定的电叔父推算机始于。” 虽然初期的遮罩很难达到这个要求,但它归因于了许多令人印象深刻的建模:用要用位图的卷积数论模型平台;文档的气化数论模型平台;以及用要用位图、文档、口语、录像带、酶形态等的transformers。它们仍然这两项了与众不同的事情,像下围棋时的表现有约了全人类准确度,在检验X射线位图等具体勤务里头面也吻合全人类准确度。然而,它们在主旨和直觉推理方面的原因仅仅很难助长。5权衡柏树:从根到叶哲学是一个什么样的「怪物」?这位哲学家的追随者、第三世纪其有数生活在叙利亚的 Porphyry 造出了一个合乎直觉的新方法来回答这个原因。他将哲学明确指出的“假定并不一定”从一般到具体小组合成起来,将哲学依次归入到每个假设里头面:哲学的假定是物质的而不是术语或意识;他的双腿是有生命的而不是无生命的;他的思想是理性的而不是非理性的。因此,他的假设是全人类。里头面世纪的直觉教师将这个序列绘制为垂交点阵图:一个早期的权衡柏树。大写字母相异:快进到 1963 年,密西根大学社则会学家John Sonquist和金融学家James Morgan在将调查的受访者配对时,首次在推算机里头面实行了权衡柏树。随着定时体能训练方法应用软件的注意到,这种实习变得很普遍,现在最主要 scikit-learn 等在内的各种数据处理流血事件库里头也仍然应用要用权衡柏树。这套code是由加州大学洛杉矶分校洛杉矶分校和加州大学洛杉矶分校伯克利分校的四位海洋学家花费了10 年整整开发的。到今天,从头开始编写权衡柏树仍然成为了《数据处理流血事件 101》里头面的一项家庭作业。空里头面的根:权衡柏树可以分派假设或重返。它向右生宽,从树皮到柏树冠,将一个权衡层次形态的回传下例假设为两个(或更加多)。想到瑞士医学家和全人类学家Johann Blumenbach的课题:大概在 1776 年,他首可先将猩猩与犀牛(撇开全人类除外)区分出去,在此以前,猩猩和犀牛是被归为一类的。这种假设取决各种常规,例如是否有尾巴、脸部狭窄或开阔、是交立还是蹲伏、还有智力的高低。应用要用经体能训练的权衡柏树来为这爬行两栖动物贴上标记,逐一考虑到每个常规,最后将这两小组两栖动物分开。这棵柏树从一个可当作看成了所有个案的人类在线里头库里头的根键值出发——黑猩猩、大猩猩和红毛猩猩,以及卷尾蟾蜍、黑猩猩和金翅雀蟾蜍。根则会在两个叔父键值有数备有考虑到,是否表现出某种特定特点,引发两个叔父键值看成带有和不带有该特点的下例。类推,这个现实生活里头面以可任意总数的叶键值终结,每个叶键值都看成大部分或全部仅指一个并不一定。为了成宽,柏树必须看到根权衡。要要用考虑到,则得考虑到所有的特点及其价数值——后附肢、桶状胸等——并考虑到能够最大限度提高分割镍的那个特点。「最佳镍」被假设为一个并不一定下例则会 100% 踏入一个特定的叔父键值、而不踏入另一个键值。尾端较少在只要用了一个立即在此之后就百分之百纯粹、且很意味著而则会也达不到。随着这个现实生活之前顺利顺利进行,归因于一个又一个层次的叔父键值,交至镍不则会因为考虑到更加多的特点而减少多少。此时,这棵柏树柏树仍然完全体能训练好了。在推理时,一个重新下例最上层经历过权衡柏树,顺利进行每个最高级别不同权衡的评估。它则会获得它所在叶键值所看成的在线里头标记。踏入前 10 名:鉴于 Blumenbach 的结论(自此被Charles Darwin夺权),即全人类与犀牛的区别在于开阔的骨盆、握和紧牙的牙齿,如果我们想引入权衡柏树以不仅假设犀牛和猩猩,而是对全人类顺利顺利进行假设,那则会怎么样呢?澳大利亚推算机生物学家 John Ross Quinlan 在 1986 年通过 ID3 假定了这一意味著,它引入了权衡柏树,以支持非二元结果。2008 年, 在IEEE全球性在线里头挖掘则会议策划的在线里头挖掘十大方法之列里头面,一项命名为 C4.5 的引入提高效率方法名列前茅。在一个创新司空见惯的世界性里头,这就是持久力。扒开柏枝条:权衡柏树确实有一些好处。它们很不易通过减少多最高级别层次来过份匹配在线里头,以至于叶键值只最主要一个例叔父。更加可悲的是,它们很不易注意到蝴蝶效应:更加换一个例叔父,宽出来的柏树就都和。跟着进丛林:宾夕法尼亚州海洋学家 Leo Breiman 和新西兰海洋学家 Adele Cutler 将这一特点再生为优势,于 2001 年开发了随机丛林(random forest)——这是一个权衡柏树的集合,每个权衡柏树则会处理流血事件不同的、重叠的下例考虑到,并对最后结果顺利顺利进行投票。随机丛林和它的表亲XGBoost不有点不易过份匹配,这有助于使它们成为最受欢迎的数据处理流血事件方法之一。这就像让哲学、Porphyry、Blumenbach、Darwin、 Jane Goodall、Dian Fossey和其他 1000 位两栖动物学家一起在窗户里头,确保你的假设是最好的。6K均数值聚类:群体思维如果你在布道上与其他人站得很近,那么你们很意味著有一些某种程度。这就是应用要用 k 均数值聚类将在线里头点配对的或许。无论是通过全人类机构还是其他自我意识形成的群体,这个方法都则会看到它们。从爆炸流血事件到拨号音:宾夕法尼亚州核物理学家 Stuart Lloyd 是贝尔实验室标志性创新工厂和申请专利原叔父弹的曼哈顿区蓝图的名教授,他于 1957 年首次明确指出 k-means 聚类,以在大写字母信号里头面相应信息,但交到 1982 年才发表这个实习:期刊地址:~roweis/csc2515-2006/readings/lloyd57.pdf与此同时,宾夕法尼亚州海洋学家 Edward Forgy 在 1965 年说明了了一种近似于的新方法,引发了它的替代名援引要用「Lloyd-Forgy 方法」。四处寻找里头面心地带:考虑到将聚类分成追随的公安部。取值窗户里头面与则会者的一段东北方和要形成的小组数,k-means 聚类可以将与则会者分成大小大致等同于的小组,每个小组都汇聚在一个的里头面心地带或刚体外围。在体能训练其有数,方法最初通过随机考虑到 k 人来以外 k 个刚体。(K 必须握动考虑到,看到一个给定数值有时比较极为重要。)然后它通过将每个人与仍然有的刚体除此以外来增宽 k 个炮兵部队。对于每个炮兵部队,它推算相应到该小组的的人的高达一段东北方,并将该高达一段东北方以外为重新刚体。每个重新刚体意味著都很难被一个人囊括,但那又如何呢?人们激进于汇聚在巧克力和甜品外围。推算出重新刚体后,方法将母体重新相应到离他们仍然有的刚体。然后它推算重新刚体,相应炮兵部队,等等,交到刚体(以及它们外围的小组)不再移动。在此之后,将新成员相应到恰当的炮兵部队就很不易。让他们在窗户里头就位并四处寻找仍然有的刚体。预可先警告:鉴于最初的随机刚体相应,你意味著最后不则会与你努力与之相处的以在线里头为里头面心地带的可爱 AI 生物学家在同一小组里头面。该方法要用得较好,但不能保障看到最佳解决方案。不同的东北方:当然,聚类普通人错综复杂的东北方不均能够较大。两个向量错综复杂的任何度量都可以。例如,k-means 聚类可以根据他们的服装、职业或其他并不一定来划分他们,而不是根据物理东北方对交接参与派对的人顺利顺利进行配对。在线店面应用要用它根据顾客的喜好或行为来划分顾客,核物理学家也可以将不尽相同特性的月光分在一小组。在线里头点的自我意识:这个或许归因于了一些显着的变立体化:K-medoids 应用要用具体在线里头点作为刚体,而不是取值炮兵部队里头面的高达一段东北方。的里头面心地带是可以将到炮兵部队里头面所有点的东北方大于立体化的点。这种变立体化更加不易推论,因为刚体始终是在线里头点。Fuzzy C-Means Clustering 使在线里头点能够不同准确度地参与多个炮兵部队。它根据与刚体的东北方,用炮兵部队的度来代替硬簇相应。n 维狂欢节:尽管如此,原始形式的方法仅仅尤其有益——特别是因为作为一种无统筹方法,它不均能够收集昂贵的标记在线里头。它的应用要用速度也很慢。例如,最主要 scikit-learn 在内的数据处理流血事件库里头受益于 2002 年掺入的 kd-trees,这些 kd-trees 可以比较并能地划分于其在线里头。原文文档:
长沙看牛皮癣去哪家医院最好
成都看白癜风什么医院最好
郑州不孕不育治疗方法
株洲看妇科哪家医院专业
男性女性保健用品
急支糖浆有什么作用
中医减肥
感冒咳嗽吃什么好
阳了吃什么药好得快
雷峰门户网站
。海南男科医院哪个最好长沙看牛皮癣去哪家医院最好
成都看白癜风什么医院最好
郑州不孕不育治疗方法
株洲看妇科哪家医院专业
男性女性保健用品
急支糖浆有什么作用
中医减肥
感冒咳嗽吃什么好
阳了吃什么药好得快
相关阅读
- 国羽男单临时出头落寞背影,赛季仍无缘决赛,不气馁期待摆脱困境
- 去年战绩傲视全国家联盟 如今队拆得面目全非 爵士成这样拜独行侠所赐
- 漳州福清江阴港现放射状晚霞 美轮美奂
- 足协罚款:广州队新星因暴力行为停赛3场 罚款人民3万元
- 输不起了,周琦归队合练高诗岩或改用徐杰,次战中国男篮不容有失
- 中国乒乓球大捷!3-2,王楚钦、王曼昱大肾脏,1-2落后轰2-0逆转
- 2年3000万!湖人队总冠军后卫签了!西部再添争冠队
- 高烧39.5度!周琦带病举行合练,为中国男篮拼了,大6岁爱妻心疼
- 孩子基础教育真是一个课题和难题
- 河南36岁二胎妈妈“喜提”奶奶个人身份,早婚早育一般要承担两个后果
- 96年公牛取得创纪录的72全胜10负,当时都输给了谁?铁三角表现如何
- 广东队好消息!马尚启程归队,下赛季或率队剑指三冠王
- 广东:90后宝妈连生五个儿子后又怀六胎?当事人:老公想要个妹妹
- C罗女友乔治娜晒全身照,身型傲人!抱着3孩子,对待迷你罗如亲生
