banner
Leo

Leo的恒河沙

一个活跃于在珠三角和长三角的商业顾问/跨境电商专家/投资人/技术宅/骑行爱好者/两条边牧及一堆小野猫的王/已婚;欢迎订阅,日常更新经过我筛选的适合精读的文章,横跨商业经济情感技术等板块,总之就是我感兴趣的一切

2023-12-15-高效追踪学术前沿动态 - 少数派

高效追踪学术前沿动态 - 少数派#

#Omnivore

Matrix 首页推荐

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。

文章代表作者个人观点,少数派仅对标题和排版略作修改。


前言#

文献检索与阅读对于科研工作者的重要性是不言而喻的。在不同的情境(研究阶段)下,检索与阅读的方式会有不同:一是在涉足陌生领域时,我们主动、集中地搜集和阅读,目的是快速了解该领域的发展历史与现状;二是正在进行一个研究时,我们已经对领域内的情况有了较为全面的把握,阅读文献更多地呈现被动、分散的特点,即依赖文献推送或不定期地查阅重点期刊,重点研究团队成果,目的是从最新的研究中得到借鉴和启发,并适时优化自己的技术路线。

本文将针对第二种情境,分享我的文献追踪习惯和工具。我是工科背景,观点以及所介绍的方式方法不免有局限性,请读者见谅。

我的学术前沿追踪习惯#

Google Scholar、微信公众号和 Web of Science#

在开启学术生涯的前期,我习惯使用 Google Scholar 进行文献的订阅,这应该是我们最基础也是最常使用的工具了。 Google Scholar 通过电子邮件的方式进行提醒。在我看来,方式过于老派,我打开邮箱时不一定进入了阅读的状态,加之邮箱的「永久」存储功能,不免产生稍后阅读的惰性。

相比之下,阅读微信公众号更加便捷。而我的老板和师兄弟间也经常分享公众号上的研究速递。我在《家庭服务器 Home Server 实践》中提到过,我很讨厌在微信内阅读公众号:一是消息在时间排序上是乱序的;二是在内容上无法按照类别浏览,我无法让大脑做到在科研内容和娱乐内容间迅速切换;三是在浏览时会插播很多推荐内容,但我并不感兴趣;四是没有阅读记录,我无法判断哪些文章读过了,也无法标记稍后阅读,我的「文件传输助手」也就充当了「稍后阅读」的功能。

image

沙师弟误入 & 文件传输助手版「稍后阅读」

但不可否认,微信公众号内还是有很多有价值的文章、资讯。也有很多服务提供了微信公众号的内容订阅,比如 Feeddd 和 WeRSS 的订阅服务。但这些服务或是实时性不高,比如几天甚至几周才会更新一次;或是价格昂贵。

由一次撰写综述的机会,接触到了 Web of Science。在这之前,我嫌弃它的访问 IP 限制和时效性低,但这次使用,其文献信息的完整度、准确度和严谨的引证数据给了我们很大帮助。同 Google Scholar 一样,Web of Science 通过电子邮件的方式进行订阅。1

三种订阅方式的对比#

Google Scholar、微信公众号和 Web of Science 这三种方式各有优缺点,我简单做了一个对比。

| | 微信 | Google Scholar | Web of Science | |
| ---- | -------------- | -------------- | --- |
| 时效性 | ⭐⭐ | ⭐⭐⭐ | ⭐ |
| 相关度 | ⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| 定制化 | ⭐ | ⭐⭐ | ⭐⭐⭐ |

  • 时效性方面。Google Scholar 一般在论文 Online 一周内就会收录,微信公众号的推文受文章质量和是否由作者投稿影响,总体来说不如 Google Scholar。Web of Science 在时效性方面是最差的,一般从论文见刊到被 Web of Science 收录要等一段时间,取决于期刊编辑是否勤快,常见的是 1~3 月。
  • 相关度方面。Google Scholar 和 Web of Science 均提供了作者订阅、引文订阅的过滤工具,相关度是差不多的。而微信由于推送内容完全不由读者决定,消息的相关度是最弱的。
  • 定制化方面。在 Web of Science 上可以对检索式创建跟踪服务,在定制化方面无疑是最强的。Google Scholar 主要可以对作者、引文进行跟踪。微信,可以选择订阅不同的公众号,可能也算是一种定制吧,笑。

除此之外,三者都有一些独特的地方。

  • Google Scholar 会抓取预印本和专利,这其实是变相加强了其时效性。
  • 微信公众号推送的论文与自己的研究相关度低,但对于学科交叉领域的研究者来说,只要选对了公众号,时常会有惊喜。有时,公众号的稿件也会邀请作者进行解读,也会透露出论文之外的细节信息。此外,公众号还会推送会议通知、招聘信息、学术八卦,也算是学术生活中的谈资吧。
  • Web of Science 的时效性是比较低的,但其缺点也仅限于此,只要维护好检索式,我会有种安心感,领域内的任何论文最终都会推送给我,很难有漏网之鱼。

image

公众号资讯: 作者解读、会议通知、招聘发布

为什么不直接采用期刊订阅源#

很多学术期刊提供了 RSS 源,订阅起来很方便,但除了少量的几本小领域期刊外,整体相关度低、查阅费时费力,获取有效文献的效率低。但是,根据老板的建议和课题组的习惯,我们还是会额外关注一下 Nature、Science 等高影响力的综合期刊,一方面是高质量的论文可能激发我们新的灵感,另一方面是了解一下学术圈的热点研究。

新平台各显身手#

在继续之前,聊聊为什么没有选择其他平台进行文献订阅,如 ResearcherResearchgateSemantic Sc​​holarX-MOL。究其根本是已经习惯了现有的订阅途径,而其可靠性也有保证。

较为传统的学术信息聚合平台,提供了期刊订阅、关键词搜索订阅的功能,但其本质与直接订阅期刊官方 RSS、使用关键词订阅 Scholar Alert 的方式是无异的。我个人判断这类订阅方式在广度上比不过背靠搜索引擎的 Google Scholar、精准度上难以匹敌精心维护的 Web of Science。

作为新势力的代表,Semantic Sc​​holar 自称 AI 驱动的科学文献研究工具,可以基于收藏的论文,使用推荐算法将相关的论文推荐给你,其推荐的论文是可能超出施引与被引范围的,这可能有助于开拓读者的思维,但具体效果如何,我暂时无法给出评价。

image

Researcher & Semantic Sc​​holar

现在,我已经习惯同时使用 Google Scholar、微信、Web of Science 进行学术前沿动态的追踪。但由于平台间的割裂,阅读效率是比较低的,也存在着重要文献漏读的情况。我要做的,就是把这三个订阅源聚合在一起。

学术动态追踪 All in One#

Google Scholar、微信公众号、Web of Science 分别使用邮件订阅、app 订阅和邮件订阅(或网站内浏览)的方式向读者推送消息。用 RSS 将这三个信息源进行整合是一个很好的方式,套用现有的框架,只需要自制 RSS 源

image

学术动态追踪 All in One

我把这三个 RSS 源或 RSS 源自动生成脚本托管在 Github 上,读者可移步以下链接进行查看和部署:

Google Scholar 转聚合订阅#

通过解析 scholaralerts-noreply@google.com 的邮件信息,将论文的标题、作者、摘要、源链接按照 RSS 协议组装好,生成 xml 文件,并由 nginx 托管,即制作好一个 Google Scholar 的 RSS 源。在 Scholar-to-RSS 中,读取的收件邮箱为 Outlook 邮箱,可以在 Google Scholar Alerts 页面设置 Outlook 为接收邮箱;也可以在其它邮箱内接收,把发件人为 scholaralerts-noreply@google.com 的邮件转发至 outlook 邮箱。需要读者自行生成 Outlook 的 API Token,具体方法参考项目文档。

Web of Science 转聚合订阅#

Web of Science 的订阅可以通过邮件获取,也可以通过登录后的 Web of Science 主页读取,点击邮件内的链接会进行重定向,速度不如在主页上点击获取。我们使用自动化网页的方式读取订阅主题,并下载推送文献的详细信息。解析论文的标题、作者、摘要、DOI 链接、自动完成标题和摘要的翻译,按照 RSS 协议组装好,生成 xml 文件,并由 nginx 托管,即制作好一个 Web of Science 的 RSS 源。在解析的过程中,同时将数据保存 / 读取为 sqlite 数据库,通过 DOI 进行查重,避免重复的推送

由于 Web of Science 的访问限制,设置了两种模式,一是校内模式,即 IP 订阅了 Clarivate 的相关服务,可直接访问,二是校外模式,即 IP 未订阅 Clarivate 的相关服务,需通过中国教育和科研计算机网联邦认证与资源共享基础设施(CARSI) 认证进行访问。

配置 WoS-to-RSS,需要 Web of Science 登录邮箱与密码,对于校外模式的访问者,还需配置所在高校以及统一认证方式(学号,密码)。

image

Google Scholar, WoS in Feedme

微信公众号转聚合订阅#

微信公众号的订阅是一个老大难的问题。为项目安全考虑,未考虑公开详细的技术路线,请读者在《家庭服务器 Home Server 实践》寻找实现功能的关键词,请注意,没有开箱即用方法。

当然,读者不会空手而归,在 Wechat-Scholar 中,我提供了免费的微信公众号订阅源,但只提供学术类微信公众号转 RSS 服务。何为学术类公众号?我定义为主打学术资讯、论文分享、高质量科普的公众号。时效性方面,Wechat-Scholar 每日 7 am 和 14 pm 更新,保留最新 20 条(或近 7 日)的内容。如果列表中找不到您需要的公众号,可发起 Issues 请求添加。此外,Wechat-Scholar 不提供全文输出,请在 RSS 客户端获取全文。

image

Wechat in Feedme

聚合订阅与过滤#

Google Scholar 和 Web of Science 的推送质量完全取决于我们预设的跟踪内容,滥用跟踪会导致有价值的文献被稀释,这要求我们细心维护跟踪条目。

跟踪有三大类:引文跟踪、检索跟踪、作者跟踪 。2

最近发现 WoS 上线了第四种分类 Recommendations alert: Alert will email you once a month with personalized article recommendations. 推荐算法未知,作者尚未使用

在 Google Scholar 中,我只设置了作者跟踪。Web of Science 中设置全部三类跟踪,引文跟踪的关键在于找到领域内的开山祖师式或里程碑式论文,随着时间的推移,里程碑式论文需要适时更新;检索跟踪关键在于关键词的设定,一般是领域中公认的专业名词组合或缩写组合;作者跟踪,可以把领域内相关的学者全部选定。

image

Web of Science 跟踪订阅

将微信公众号转换为聚合订阅后,会被其海量的信息淹没,做好信息的过滤配置是必要的。我通过关键词进行分类 / 过滤,如「荐号」「面试」「年薪」「招聘」「预约」「会议」「通知」等等。

image

TTRSS 中的过滤与预定义标签

阅读与沉淀#

在仅支持移动端的 RSS 阅读器内阅读文献是不现实的,我推荐选择跨平台的 RSS 阅读器。在食堂排队时、通勤时、如厕时,随时随地粗读摘要,做好筛选收藏后,在「生产力平台」再进行进一步的知识沉淀。

结语#

我们利用聚合订阅实现了学术前沿追踪的 All in One,在统一的入口内,能集中地浏览学术资讯。

对科研大佬而言,这些可能只是雕虫小技,但希望这些小工具能帮到在一线忙碌的科研人。

> 关注 少数派公众号,解锁全新阅读体验 📰

> 实用、好用的 正版软件,少数派为你呈现 🚀

  • 1 也可以在 WoS 个人主页上进行访问。
  • 2 最近发现 WoS 上线了第四种分类 Recommendations alert: Alert will email you once a month with personalized article recommendations. 推荐算法未知,作者尚未使用

Google Scholar、微信公众号和 Web of Science

© 本文著作权归作者所有,并授权少数派独家使用,未经少数派许可,不得转载使用。

読み込み中...
文章は、創作者によって署名され、ブロックチェーンに安全に保存されています。