【愛可可獨家秘籍】僅需四步,教你高效閱讀arXiv論文

【新智元導讀】愛可可老師教你僅需四步,就能高效閱讀arXiv上的論文:想清楚讀論文的目標和定位;「形、神、從」三個角度巧選論文;大量泛讀+少量精讀;勤總結,多分享。

長話短說,先看圖:

總的來說,arXiv學海無涯,泛舟有道:想清楚,巧選擇,多泛讀,勤總結。其實不止arXiv,其他論文也一樣,只是arXiv流量大,更需要技巧。

有人說arXiv垃圾太多,不值一讀,這種說法,我深感不以為然。我在微博上曾說過——如果你愛它,就把它發到arXiv,因為那裡是聖殿;如果你恨它,就把它發到arXiv,因為那裡是垃圾場。

arXiv就是這麼個魚龍混雜,讓人又愛又恨的地方。平心而論,arXiv上高素質的論文不在少數,且有快速上升之勢,廢話少說,看數據:2017年,理論計算機科學與機器學習領域,超過60%的發表論文都有arXiv電子版。且不說arXiv還有最美的兩點:快& 多 。「快」自不必細表,第一時間洞悉實力團隊最新方向/成果,零延時跟蹤最新問題/技術前沿,arXiv是個太理想的地方,期刊、會議絕無勝算;「多」怎麼也成了優點?因為多,所以雜,統計上才能更有效代表整體趨勢——占坑也好,廢稿也罷,良莠不齊,總量龐大,一分析,哪有路、哪是坑、哪深哪淺自然清清楚楚——雜訊不可怕,因為雜訊,才真實,分佈才有連續性,才可信。說arXiv全是垃圾的,八成是沒深入研究、懶得淘金的人。怎麼讀?光靠勤奮還不夠,得講方法,講策略。

Advertisements

第一步,想清楚

想什麼?想定位,想目標,想方法。

為啥而看?跟蹤前沿?找問題?找方法?膜拜?探坑?找人?找撕?學寫作?湊談資?打發時間?定位清楚了,題材範圍自然清晰,不了解自己,只能「通吃」,結果往往是「消化不良」。

不管什麼定位,有一點很重要:抱著學習的心態去讀,收穫往往更多。挑剔不會讓你顯得更有水平,取其精華,取長補短,才是成長正道。

前陣子Kyunghyun Cho在關於博士生為學之道的訪談里提到了「過度閱讀」:

Excessive reading can create additional boundaries, holding aresearcher away from trying out new ideas.

Advertisements

說的是「過度閱讀」有反作用,像「砌牆」,會妨礙你嘗試新想法。解決方法很簡單——擺正心態,就無所謂「過度」:讀論文讀的不是邊界,是思考,是啟迪,讀完該做什麼堅持去做:

Pursue your direction, try yourself, no matter if someone wassuccessful or not in this direction so far.

讀論文的同時也不要忽略讀書——打好基礎很重要,尤其是論文作者認為「大家都懂」的「常識性」知識。基礎好才有「根」,新來的知識和思考才有關聯和生長的「干」,終能長成一棵健康茂密的參天之「樹」。

第二步,巧選擇

讀arXiv,選擇很關鍵,選對了,就成功了一半。簡言之,選擇看三點:形、神、從。

形:看的是論文的表象,具體包括出處、題目、文字和圖表。

無疑,題目和出處是粗篩最有效的特徵——題目言之有物、簡短有趣、問題方法立意新穎,作者、機構耳熟能詳,可迅速排除50%的論文,當然,根據具體定位,對作者、出處相對陌生的文章,不妨多一些寬容,如果標題有趣可以泛讀試試,有時也會出現「驚喜」;

文字部分,一看摘要和導言,二看全文結構。摘要開門見山,重點突出,導言對問題、難點、相關工作和本文工作交代清楚、邏輯嚴謹,全文結構緊湊不拖沓,引用全面的論文,可優先入選;

圖表部分,要求說明完整,自成一體又與文字相呼應。好的圖表,應該能體現本文的思想和特色,配合文字說明,能了解論文的角度和作者的思考。

神:看的是論文的內涵,具體包括主旨、韻律和風格。

好的論文,主旨明確,角度合理,思路清晰,一條線索貫穿全文;

論文的韻律,是對內容輕重詳略的編排,好的論文焦點明確,節奏得當,一眼能找到作者重點要表達的內容;

好的論文,一定不是自說自話,更像是與讀者之間的對話,對於讀者關心的方面和潛在的問題,都會貼心地預先作答,用主線引領讀者順暢閱讀。

從:看其他讀者的推薦和反饋,可從一人,也可從眾。

跟隨他人,恐怕是最便捷的一條選擇之路,但有時可遇不可求。

跟隨一個人,看的是對方的方向和品味。選擇跟著誰,這是個不小的難題,就像是推薦系統做到最後,重點不在物物關聯,而在找對要協同的用戶。如何衡量對方是否值得「追隨」呢?可以看是不是滿足多、少、信三個條件。多是指不但樂於分享,還能堅持不懈的持續分享;少是指在選讀論文方面有統一的品味和態度,寧缺毋濫;信是說可信,水準穩定,不輕易「夾帶私貨」。如果找到一位符合以上三點的人,又恰巧和你方向相似或部分重合,那絕對是可喜可賀!我在努力尋找這樣的人,也在努力做這樣的人,利己,利人,希望你也一樣。

從眾,也許算得上是條捷徑,大眾關注的,必有其看點,炒作也好,批判也罷,「焦點」就是這麼一種特別的東西,你不必完全「明白」,但「知道」一定有益無害。

以上所說,只是用來判斷論文質量的一些粗淺「招式」,當你藉助這些方法幫自己找出一定量的「好」論文,就會逐漸找到篩選論文的感覺和自信,這時候,就像習武的更高境界——「無招」勝"有招",可以輕鬆給論文打個比較客觀的總分了,相信這一天不會太遠。

第三步,多泛讀

終於到了讀論文的時候,別激動,也別忙著深入細節,先把策略搞清楚。建議大量泛讀,極少量精讀,避免走讀。

泛讀看什麼?看問題、看難點、看相關工作、看本文的角度和特色,重在拓展視野、延伸思考、充實基本面;

精讀看什麼?深入學習,不錯過每一點細節,避免道聽途說遺漏重點。只有對自己特別「有用」的論文才精讀,一旦選定切勿淺嘗輒止、囫圇吞棗。

打定主意,嚴格區分,不要在「知道」和「明白」之間徘徊,做到精力的高效優化分配。

讀論文,重在思考,因聯繫、深化而增值的部分是最可寶貴的。多思考,多關聯,加深、拓寬,為自己的知識體系添枝散葉,才是閱讀的意義所在。

第四步,勤總結

把閱讀的收穫及時總結、適時回顧是個很好的習慣。學習的過程,就是不斷地抽象、鞏固,適當的重複不但會加強你的記憶,也會啟發出一些更深入的思考。

試著多和別人分享,尤其是精讀的文章。就像費曼先生說的:「要是你無法用簡單樸素的語言解釋清楚,說明你還沒有真正理解」,講給別人聽,是檢驗自己是否真正讀懂的有效基準。

可以聽別人分享,但不要迷信,更不要當做了解新知的捷徑,偷懶取巧只會得不償失,老話說得沒錯:「想要知道梨的滋味,就要親口嘗一嘗」再細緻的閱讀分享,也不如老老實實閱讀一遍原文來得實在。

Advertisements

你可能會喜歡