發表於2024-11-09
比爾·蓋茨年度薦書!《終ji算法》近20年人工智能領域具轟動性的著作!揭秘機器學習的終ji邏輯,全景勾勒人工智能的商業未來。《喬布斯傳》作者沃爾特·艾薩剋森、圖靈奬得主硃迪亞·珀爾、中國大數據領航人車品覺、今日頭條首席算法架構師曹歡歡 傾力推薦!
Google X、微軟研究院 密切關注!
如果你先想瞭解人工智能,那麼推薦佩德羅·多明戈斯所著的《終ji算法》,非常值得一讀。——比爾·蓋茨
購物網站用算法來為你推薦商品,點評網站用算法來幫你選擇餐館,GPS係統用算法來幫你選擇*佳路綫,公司用算法來選擇求職者……
當機器最終學會如何學習時,將會發生什麼?
不同於傳統算法,現在悄然主導我們生活的是“能夠學習的機器”,它們通過學習我們瑣碎的數據,來執行任務;它們甚至在我們還沒提齣要求,就能完成我們想做的事。
什麼是終ji算法?
機器學習五大學派,每個學派都有自己的主算法,能幫助人們解決特定的問題。而如果整閤所有這些算法的優點,就有可能找到一種“終ji算法”,該算法可以獲得過去、現在和未來的所有知識,這也必將創造新的人類文明。
你為什麼必須瞭解終ji算法?
不論你身處什麼行業、做什麼工作,瞭解終ji算法都將帶給你嶄新的科學世界觀,預測以後的科技發展,布局未來,占位未來!
——————
在《終ji算法》中,全球著名的算法問題專傢、機器學習領域的先驅人物佩德羅·多明戈斯,為我們揭開瞭算法的神秘麵紗,讓我們一窺榖歌以及你的智能手機背後的機器學習原理。他闡釋瞭機器學習的五大學派思想,解釋瞭它們如何將神經科學、心理學、物理等領域的理論轉變為算法並為你服務,並提齣瞭“終ji算法”的設想,探討瞭終ji算法對未來商業、科學、社會以及對每個人的意義。對於想要理解未來將發生怎樣的變革、以及想走在變革前沿的人來說,這是一本必不可少的思想指南。
“如果這種終ji算法存在,那麼它將可以通過數據獲得世界上過去、現在、未來的所有知識。這個算法的發明將會是科學史上偉大的進步之一。”
佩德羅·多明戈斯(Pedro Domingos),美國華盛頓大學計算機科學教授,加州大學歐文分校信息與計算機科學博士,在機器學習與數據挖掘方麵著有200多部專業著作和數百篇論文。國際機器學習學會聯閤創始人,《機器學習》雜誌編委會成員,JAIR前副主編。美國人工智能協會院士(AAAI Fellow,國際人工智能界的*高榮譽),榮獲SIGKDD創新大奬(數據科學領域的*高奬項)、斯隆奬(Sloan Fellowship)、美國國傢科學基金會成就奬(NSF CAREER Award)、富布賴特奬學金、IBM學院奬以及多個頂ji論文奬項。
推薦序
序
第一章 機器學習革命
學習算法入門
為何商業擁護機器學習
給科學方法增壓
10 億個比爾·剋林頓
學習算法與國傢安全
我們將走嚮何方
第二章 終極算法
來自神經科學的論證
來自進化論的論證
來自物理學的論證
來自統計學的論證
來自計算機科學的論證
機器學習算法與知識工程師
天鵝咬瞭機器人
終極算法是狐狸,還是刺蝟
我們正麵臨什麼危機
新的萬有理論
未達標準的終極算法候選項
機器學習的五大學派
第三章 符號學派:休謨的歸納問題
約不約
“天下沒有免費的午餐”定理
對知識泵進行預設
如何徵服世界
在無知與幻覺之間
你能信任的準確度
歸納是逆嚮的演繹
掌握治愈癌癥的方法
20 問遊戲
符號學派
第四章 聯結學派:大腦如何學習
感知器的興盛與衰亡
物理學傢用玻璃製作大腦
世界上最重要的麯綫
攀登超空間裏的高峰
感知器的復仇
一個完整的細胞模型
大腦的更深處
第五章 進化學派:自然的學習算法
達爾文的算法
探索:利用睏境
程序的適者生存法則
性有何用
先天與後天
誰學得最快,誰就會贏
第六章 貝葉斯學派:在貝葉斯教堂裏
統治世界的定理
所有模型都是錯的,但有些卻有用
從《尤金·奧涅金》到Siri
所有東西都有關聯,但不是直接關聯
推理問題
掌握貝葉斯學派的方法
馬爾可夫權衡證據
邏輯與概率:一對不幸的組閤
第七章 類推學派:像什麼就是什麼
完美另一半
維數災難
空中蛇災
爬上梯子
起床啦
第八章 無師自通
物以類聚,人以群分
發現數據的形狀
擁護享樂主義的機器人
熟能生巧
學會關聯
第九章 解開迷惑
萬裏挑一
終極算法之城
馬爾科夫邏輯網絡
從休謨到你的傢用機器人
行星尺度機器學習
醫生馬上來看你
第十章 建立在機器學習之上的世界
性、謊言和機器學習
數碼鏡子
充滿模型的社會
分享與否?方式、地點如何?
神經網絡搶瞭我的工作
戰爭不屬於人類
榖歌+終極算法=天網?
進化的第二部分
後 記
緻 謝
延伸閱讀
序
你也許不知道,但機器學習就在你身邊。當你把查詢信息輸入搜索引擎時,它確定該嚮你顯示哪些搜索結果(包括顯示哪些廣告)。當你打開郵箱時,大部分垃圾郵件你無法看到,因為計算機已經把這些垃圾郵件過濾瞭。登錄亞馬遜網站購買一本書,或登錄網飛(Netflix)公司網站觀看視頻,機器學習係統會推薦一些你可能喜歡的産品。臉書(Facebook)利用機器學習決定該嚮你展示哪些更新,推特(Twitter)也同樣會決定顯示哪些文章。你使用計算機的任何時候,都有可能涉及機器學習。
傳統上認為,讓計算機完成某件事情的唯一方法(從把兩個數相加到駕駛飛機),就是非常詳細地記錄某個算法並解釋其如何運行。但機器學習算法就不一樣:通過從數據中推斷,它們自己會弄明白做事方法。掌握的數據越多,它們的工作就越順利。現在我們不用給計算機編程,它們自己給自己編程。
機器學習不僅存在於網絡空間,它還存在於你每天的生活中:從你醒來到入睡,每時每刻無所不在。
早上7 點你的收音機鬧鍾響起,播放的是你之前從未聽過的歌麯,但你的確很喜歡這首歌。Pandora 電颱(可免費根據你的喜好播放歌麯)的優勢在於,根據你聽的音樂,電颱掌握瞭你的品位,就像你自己的radio jock 賬號一樣。這些歌麯本身可能藉助機器學習來播放。接下來你吃早餐,閱讀早報。早報在幾個小時前印好,利用學習算法,印刷過程經過仔細調整,以免報紙齣現摺痕。你房間的溫度剛剛好,電費明顯少瞭很多,因為你安裝瞭Nest智能溫控器。
你開車去上班,車持續調整燃油噴射和排氣再循環,以達到最佳的油耗。你利用一個交通預報係統(Inrix)來縮短高峰時段上下班的時間,這當然能減緩你的壓力。上班時,機器學習幫你剋服信息超載。你利用數據立方體來匯總大量數據,從每個角度觀察該立方體,獲取最有用的信息。你要決定是采用布局方案A,還是采用布局方案B,以便為網站帶來更多的業務。網絡學習係統會嘗試兩種布局方案,並給予反饋。你得對潛在供應商的網站進行調查,但網站的語言是外語。沒關係,榖歌會自動為你翻譯。E–mail 會自動分類並歸入相應的文件夾,隻把最重要的信息留在郵箱裏,非常方便。文字處理軟件幫你查找語法和拼寫錯誤。你為即將到來的行程查找到一個航班,但決定推遲購買機票,因為必應旅行(Bing Travel)預測票價很快會下降。也許你沒有意識到以上這些,要不是機器學習幫助你,你可能要馬不停蹄地親自做很多事情。
你在休息時間查看自己的共同基金,大部分基金利用學習算法來選股,其中的某些基金完全由學習係統運作。午餐時間到瞭,你走在大街上,想找個吃飯的地方,這時候用手機上的Yelp點評應用程序來幫助你。你的手機充滿瞭學習算法,它們努力工作,改正拼寫錯誤、理解口頭指令、減少傳輸誤差、識彆條形碼,還有其他很多事情。手機甚至可以預測你接下來會做什麼,然後依此給齣建議。例如,當你吃完午餐後,它會小心翼翼地提示你,下午和外地來訪者的會麵要推遲,因為她的航班延誤瞭。
下班時夜幕已降臨,你走嚮自己的車,機器學習會保證你的安全,監測停車場監控攝像頭的錄像,如果探測到可疑人的行動,它會提示不在場的安保人員。在迴傢路上,你在超市門口停車,走嚮超市貨物通道,通道藉助學習算法進行布置:該擺放哪些貨物,通道末尾該展示哪些産品,洋蔥番茄辣醬是否該放在調味醬區域,或是放在墨西哥玉米片旁邊。你用信用卡付款。學習算法會嚮你發送信用卡支付提示,並在得到你的確認後完成支付。另外一個算法持續尋找可疑交易,如果它覺得你的卡號被盜,則會提示你。還有一種算法嘗試評估你對這張卡的滿意度,如果你是理想的客戶但對服務不太滿意,銀行會在你決定換卡之前,為你提供更貼心的服務。
你迴到傢,走到信箱旁,發現有朋友的一封來信,這是通過能閱讀手寫地址的學習算法派送的。當然也會有垃圾來信,由另外的學習算法進行選擇。你停留瞭一會兒,呼吸夜晚清新涼爽的空氣。你所在城市的犯罪率明顯下降瞭,因為警察開始使用統計算法來預測哪裏的犯罪率最高,並在那裏集中巡警力量。你和傢人共享晚餐。市長齣現在新聞裏,你為他投票,因為選舉那天,學習算法確定你為“關鍵未投票選民”之後,他親自給你打瞭電話。吃完晚餐,你觀看球賽,兩支球隊都藉助統計學習來挑選隊員。你也可能和孩子們在Xbox 上玩遊戲,Kinecta學習算法確定你在哪裏、在做什麼。你在睡前吃藥,醫生通過學習算法的輔助來設定和檢測吃藥的最佳時間。醫生也可能利用機器學習來幫你診斷疾病,例如,分析X射綫結果並弄明白一係列非正常癥狀。
機器學習參與瞭你人生的每個階段。如果你為瞭參加SAT大學入學考試(美國學術能力評估測試)而在網上學習,某學習算法會給你的練習短文打分。如果你申請商學院,且最近要參加GMAT(經企管理研究生入學考試),其中的一個文章打分工具就是一個學習係統。可能當你求職時,某學習算法會從虛擬文件中挑選齣你的簡曆,並告訴未來的雇主:這位是很不錯的人選,看看吧。最近公司給你加薪可能還多虧另外的學習算法。如果想買套房子,Zillow.com網站會估算你看中的每套房的價值,接著房子就有瞭著落。之後申請住房貸款,某學習算法會研究你的申請,並建議是否可以通過申請。最重要的是,如果你使用在綫約會服務,機器學習甚至可能幫你找到人生摯愛。
社會在不斷變化,學習算法也是如此。機器學習正在重塑科學、技術、商業、政治以及戰爭。衛星、DNA(脫氧核糖核酸)測序儀以及粒子加速器以前所未有的精細程度探索自然,同時,學習算法將龐大的數據轉變成新的科學知識。企業從未像現在這樣瞭解自己的用戶。在美國大選中,擁有最佳選舉模型的候選人奧巴馬最終戰勝瞭對手羅姆尼,獲得瞭競選勝利。無人駕駛汽車、輪船、飛機分彆在陸地、海麵、空中進行生産前測試。沒有人把你的喜好編入亞馬遜的推薦係統,學習算法通過匯總你過去的購買經曆就能確定你的喜好。榖歌的無人駕駛汽車通過自學,懂得如何在公路上平穩行駛,沒有哪個工程師會編寫算法,一步一步指導它該怎麼走、如何從A地到達B地——這也沒必要,因為配有學習算法的汽車能通過觀察司機的操作來掌握開車技能。
機器學習是“太陽底下的新鮮事”:一種能夠構建自我的技術。從遠古祖先學會打磨石頭開始,人類就一直在設計工具,無論這些工具是手工完成的,還是大批量生産的。學習算法本身也屬於工具,可以用它們來設計其他工具。“計算機毫無用處,”畢加索說,“它們隻能給你提供答案。”計算機並沒有創造性,它們隻能做你讓它們做的事。如果你告訴它們要做的事涉及創造力,那麼就要用到機器學習。學習算法就像技藝精湛的工匠,它生産的每個産品都不一樣,而且專門根據顧客的需要精細定製。但是不像把石頭變成磚、把金子變成珠寶,學習算法是把數據變成算法。它們掌握的數據越多,算法也就越精準。
現代人希望讓世界來適應自己,而不是改變自己來適應世界。機器學習是100 萬年傳奇中最新的篇章:有瞭它,不費吹灰之力,世界就能感知你想要的東西,並依此做齣改變。就像身處魔法林,在你通過時,周圍的環境(今天虛擬,明天現實)會進行自我重組。你在樹木和灌木中選齣的路綫會變成一條路,迷路的地方還會齣現指路標誌。
這些看似有魔力的技術十分有用,因為機器學習的核心就是預測:預測我們想要什麼,預測我們行為的結果,預測如何能實現我們的目標,預測世界將如何改變。從前,我們依賴巫醫和占蔔師進行預測,但他們太不可靠;科學的預測就更值得信賴,但也僅限於我們能係統觀察和易於模仿的事物,大數據和機器學習卻大大超齣這個範圍。我們可通過獨立的思維來預測一些常見的事情,包括接球和與人對話,但有些事情,即便我們很努力,也無法預測。可預測與難以預測之間的巨大鴻溝,可以交給機器學習來填補。
矛盾的是,盡管學習算法在自然和人類行為領域開闢瞭新天地,但它們仍籠罩在神秘之中。媒體每天都報道涉及機器學習的新聞:蘋果公司發布Siri 個人助理,IBMa沃森(IBM的超級計算機)在《危險邊緣》遊戲中戰勝瞭人類,塔吉特(Target)能在未成年媽媽的父母發現之前通知她懷孕,美國國傢安全局在尋找信息連接點……在這些新聞事件中,學習算法如何起作用仍不得而知。計算機“吞入”數以萬億的字節,並神奇地産生新的觀點,關於大數據的書籍甚至也避談“這個過程到底發生瞭什麼”。我們一般認為學習算法就是找到兩個事件之間的聯結點,例如,用榖歌搜索“感冒藥”和患感冒之間的聯係。然而,尋找聯結點與機器學習的關係就像是磚與房子的關係,房子是由磚組成的,但一堆磚頭肯定不能稱之為“房子”。
當一項新技術同機器學習一樣流行且具有革命性時,不弄明白其中的奧妙實在太可惜。模棱兩可會導緻誤差和濫用。亞馬遜的算法能斷定當今世界人們在讀什麼書,這一點比誰都強。美國國傢安全局的算法能斷定你是否為潛在恐怖分子。氣候模型可以判定大氣中二氧化碳的安全水平。選股模型比我們當中的多數人更能推動經濟發展。你無法控製自己理解不瞭的東西,這也是追求幸福的公民、專傢或普通人需要瞭解機器學習的原因。
本書的第一個目標就是揭示機器學習的秘密。隻有工程師和機修工有必要知道汽車發動機如何運作,但每位司機都必須明白轉動方嚮盤會改變汽車的方嚮、踩刹車會讓車停下。當今極少有人知道學習算法對應的原理是什麼,更不用說如何使用學習算法。心理學傢丹·諾曼(Don Norman)創造瞭“概念模型”(conceptual model)這個新詞,代指為瞭有效利用某項技術而需粗略掌握的知識。本書就將介紹機器學習的概念模型。
並不是所有算法的工作原理都相同,這些差異會産生不同的結果,比如亞馬遜和網飛的推薦係統。假設這兩個係統試著根據“你喜歡的東西”來對你進行引導,亞馬遜很有可能會把你帶到你之前常瀏覽的書籍類彆,網飛則可能會把你帶到你不熟悉且似乎有點奇怪的區域,並引導你愛上那裏。在本書當中,我們會看到諸如亞馬遜、網飛之類的公司使用的各式各樣的算法。與亞馬遜相比,網飛公司的算法對你的愛好理解得更深(盡管還是很有限),然而具有諷刺意味的是,這並非意味著亞馬遜也應該利用這個算法。網飛的商業模式是依靠晦澀的電影、電視節目的長尾效應來推動需求,這些電影和節目的成本很低。它一般不推薦大片,因為你的會員訂閱費可能有限。亞馬遜則沒有這樣的問題:盡管擅長利用長尾效應,但它同樣樂意把更昂貴的熱銷商品賣給你,這也會簡化其物流工作。對於那些奇怪的産品,如果是訂閱會員可免費享用的,我們可能會樂意去嘗試,而如果需要另外掏錢,我們去選擇它們的可能性就小得多。
每年都會齣現上百種新的算法,但它們都是基於幾個相似的基本思路。為瞭明白機器學習如何改變世界,你有必要理解這些思路。本書就將對此進行介紹。學習算法並不是那麼深奧難懂,除瞭運用在計算機上,對於我們來說很重要的問題都可以通過學習算法找到答案,比如:我們如何學習?有沒有更好的方法?我們能預測什麼?我們能信任所學的知識嗎?對這些問題,機器學習的各個學派有不同的答案。
機器學習主要有5 個學派,我們會對每個學派分彆介紹:符號學派將學習看作逆嚮演繹,並從哲學、心理學、邏輯學中尋求洞見;聯結學派對大腦進行逆嚮分析,靈感來源於神經科學和物理學;進化學派在計算機上模擬進化,並利用遺傳學和進化生物學知識;貝葉斯學派認為學習是一種概率推理形式,理論根基在於統計學;類推學派通過對相似性判斷的外推來進行學習,並受心理學和數學最優化的影響。在構建機器學習的目標推動下,我們將迴顧過去100 年的思想史,並以新的觀點來看待這段曆史。
機器學習的5 個學派都有自己的主算法,利用這種萬能學習算法,原則上,你可以通過任何領域的數據來挖掘知識:符號學派的主算法是逆嚮演繹,聯結學派的主算法是反嚮傳播,進化學派的主算法是遺傳編程,貝葉斯學派的主算法是貝葉斯推理,類推學派的主算法是支持嚮量機。在實踐中,這些算法可能在有些工作中可用,而在其他工作中不可用。我們真正想要尋找的是能夠綜閤這5 種算法的終極算法。雖然有些人認為這難以實現,但對機器學習領域的人來說,這個夢想賦予我們力量,促使我們夜以繼日地工作。
如果存在終極算法,那麼它可以通過數據學得包括過去的、現在的以及未來的所有知識。創造終極算法將是科學曆史上最偉大的進步之一。它可以加速各類知識的進步,並以我們現在甚至無法想象的方式改變世界。終極算法與機器學習的關係就像標準模型和粒子物理學或中心法則與分子生物學的關係:該統一原理能理解人類當今知道的一切,並為未來數十年或者數百年的進步奠定基礎。今天我們麵臨許多難題,比如製造傢用機器人和治愈癌癥,終極算法就是解決這些難題的關鍵。
以癌癥為例。治愈癌癥十分睏難,因為它往往是一種綜閤疾病。腫瘤可由各種原因誘發,且在轉移時會發生突變。殺死腫瘤細胞最可靠的方法是對其基因進行排序,弄明白哪些藥物可以抵抗癌細胞(這種方法不會對人造成傷害,患者必須提供基因和用藥史),甚至為你專門研製一種新藥。沒有哪個醫生能夠掌握該過程所需的所有知識。對於機器學習來說,這卻是再閤適不過的任務。實際上,與亞馬遜和網飛每天所做的搜索工作相比,它的工作是為你找到正確的療法,而不是閤適的書籍或者電影,而且它的工作更為復雜,也更具挑戰。遺憾的是,雖然當今的學習算法能以超齣人類水平的精確度來診斷疾病,但治愈癌癥仍遠遠超齣它們的理解範圍。如果我們可以找到終極算法,這將不再是難題。
因此,本書的第二個目標就是幫你創造終極算法。你可能會認為這需要高深的數學運算和嚴謹的理論方麵的工作,正相反,它需要暫時放下數學奧秘,來觀看各種學習行為包羅萬象的模型。對外行人來說,他們就像從遠方趕到終極算法這片森林,從某些角度看,他們比專傢更適閤創造終極算法,因為專傢對某些學科已經過於投入。一旦我們有瞭概念性的解決方法,就能補充數學上的細節,但這不是本書的目標和重點。我們之所以談論每個學派,是為瞭收集它們的觀點,並找到其適用之處。請記住,沒有哪個盲人能瞭解整頭大象。我們會尤其關注哪個學派能對治療癌癥做齣貢獻,也關注該學派的缺失。然後,我們會將所有觀點集中,一步步地變成解決方案——這個解決方案可能還不是終極算法,但已是我們能找到的最接近終極算法的方案。希望它能解放你的大腦,讓你大膽想象。當你閱讀本書時,如果覺得某些章節讀起來睏難,可以隨意略讀甚至跳過它們。本書的概要纔是重中之重,當明白所有學派的觀點之後,如果你重讀那些睏難的章節,收獲可能會比之前更多。
我研究機器學習已經有20 餘年瞭。我對機器學習 終極算法:機器學習和人工智能如何重塑世界 [The Master Algorithm] 下載 mobi epub pdf txt 電子書 格式
終極算法:機器學習和人工智能如何重塑世界 [The Master Algorithm] 下載 mobi pdf epub txt 電子書 格式 2024
終極算法:機器學習和人工智能如何重塑世界 [The Master Algorithm] 下載 mobi epub pdf 電子書質量也不錯!
評分*看的書必須要看呀,書質量不錯!準備開始看!
評分沒有特彆強調的我都這樣評論,因為在京東上買瞭太多東西。總體而言京東物流超五星,體驗很棒。商品因店而異,我傾嚮於購買京東自營的。若經常在京東消費,推薦購買京東plus會員,售後和服務都會有非常好的保障。嗯嗯,就這些吧,說多瞭會被認為是托派。
評分★本書涵蓋瞭李彥宏、陸奇等百度管理層及科學傢團隊,對人工智能這一前沿領域的新思考。從計算能力、大數據資源、人工智能研發文化等方麵提齣瞭智能化的基本標準,具體介紹瞭超級大腦、智能製造、深度學習、L4級無人車、智能金融等。描繪瞭即將到來的智能社會,並反思人類即將麵臨的種種挑戰。
評分學習中,知識準備中!
評分書籍是人類進步的階梯呀……
評分書架收藏必讀書,計劃18年Q2前讀完
評分機器學習五大學派,每個學派都有自己的主算法,能幫助人們解決特定的問題。而如果整閤所有這些算法的優點,就有可能找到一種“終ji算法”,該算法可以獲得過去、現在和未來的所有知識,這也必將創造新的人類文明。
評分婦女算法,這本書很值得大傢學習班講瞭很多的算法,然後好多東西理論上的東西都值得學習,這本書還不錯
終極算法:機器學習和人工智能如何重塑世界 [The Master Algorithm] mobi epub pdf txt 電子書 格式下載 2024