banner
Leo

Leo的恒河沙

一个活跃于在珠三角和长三角的商业顾问/跨境电商专家/投资人/技术宅/骑行爱好者/两条边牧及一堆小野猫的王/已婚;欢迎订阅,日常更新经过我筛选的适合精读的文章,横跨商业经济情感技术等板块,总之就是我感兴趣的一切

2023-12-15-高效追踪学术前沿动态 - 少数派

高效追踪学术前沿动态 - 少数派#

#Omnivore

Matrix 首页推荐

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。

文章代表作者个人观点,少数派仅对标题和排版略作修改。


前言#

文献检索与阅读对于科研工作者的重要性是不言而喻的。在不同的情境(研究阶段)下,检索与阅读的方式会有不同:一是在涉足陌生领域时,我们主动、集中地搜集和阅读,目的是快速了解该领域的发展历史与现状;二是正在进行一个研究时,我们已经对领域内的情况有了较为全面的把握,阅读文献更多地呈现被动、分散的特点,即依赖文献推送或不定期地查阅重点期刊,重点研究团队成果,目的是从最新的研究中得到借鉴和启发,并适时优化自己的技术路线。

本文将针对第二种情境,分享我的文献追踪习惯和工具。我是工科背景,观点以及所介绍的方式方法不免有局限性,请读者见谅。

我的学术前沿追踪习惯#

Google Scholar、微信公众号和 Web of Science#

在开启学术生涯的前期,我习惯使用 Google Scholar 进行文献的订阅,这应该是我们最基础也是最常使用的工具了。 Google Scholar 通过电子邮件的方式进行提醒。在我看来,方式过于老派,我打开邮箱时不一定进入了阅读的状态,加之邮箱的「永久」存储功能,不免产生稍后阅读的惰性。

相比之下,阅读微信公众号更加便捷。而我的老板和师兄弟间也经常分享公众号上的研究速递。我在《家庭服务器 Home Server 实践》中提到过,我很讨厌在微信内阅读公众号:一是消息在时间排序上是乱序的;二是在内容上无法按照类别浏览,我无法让大脑做到在科研内容和娱乐内容间迅速切换;三是在浏览时会插播很多推荐内容,但我并不感兴趣;四是没有阅读记录,我无法判断哪些文章读过了,也无法标记稍后阅读,我的「文件传输助手」也就充当了「稍后阅读」的功能。

image

沙师弟误入 & 文件传输助手版「稍后阅读」

但不可否认,微信公众号内还是有很多有价值的文章、资讯。也有很多服务提供了微信公众号的内容订阅,比如 Feeddd 和 WeRSS 的订阅服务。但这些服务或是实时性不高,比如几天甚至几周才会更新一次;或是价格昂贵。

由一次撰写综述的机会,接触到了 Web of Science。在这之前,我嫌弃它的访问 IP 限制和时效性低,但这次使用,其文献信息的完整度、准确度和严谨的引证数据给了我们很大帮助。同 Google Scholar 一样,Web of Science 通过电子邮件的方式进行订阅。1

三种订阅方式的对比#

Google Scholar、微信公众号和 Web of Science 这三种方式各有优缺点,我简单做了一个对比。

| | 微信 | Google Scholar | Web of Science | |
| ---- | -------------- | -------------- | --- |
| 时效性 | ⭐⭐ | ⭐⭐⭐ | ⭐ |
| 相关度 | ⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| 定制化 | ⭐ | ⭐⭐ | ⭐⭐⭐ |

  • 时效性方面。Google Scholar 一般在论文 Online 一周内就会收录,微信公众号的推文受文章质量和是否由作者投稿影响,总体来说不如 Google Scholar。Web of Science 在时效性方面是最差的,一般从论文见刊到被 Web of Science 收录要等一段时间,取决于期刊编辑是否勤快,常见的是 1~3 月。
  • 相关度方面。Google Scholar 和 Web of Science 均提供了作者订阅、引文订阅的过滤工具,相关度是差不多的。而微信由于推送内容完全不由读者决定,消息的相关度是最弱的。
  • 定制化方面。在 Web of Science 上可以对检索式创建跟踪服务,在定制化方面无疑是最强的。Google Scholar 主要可以对作者、引文进行跟踪。微信,可以选择订阅不同的公众号,可能也算是一种定制吧,笑。

除此之外,三者都有一些独特的地方。

  • Google Scholar 会抓取预印本和专利,这其实是变相加强了其时效性。
  • 微信公众号推送的论文与自己的研究相关度低,但对于学科交叉领域的研究者来说,只要选对了公众号,时常会有惊喜。有时,公众号的稿件也会邀请作者进行解读,也会透露出论文之外的细节信息。此外,公众号还会推送会议通知、招聘信息、学术八卦,也算是学术生活中的谈资吧。
  • Web of Science 的时效性是比较低的,但其缺点也仅限于此,只要维护好检索式,我会有种安心感,领域内的任何论文最终都会推送给我,很难有漏网之鱼。

image

公众号资讯: 作者解读、会议通知、招聘发布

为什么不直接采用期刊订阅源#

很多学术期刊提供了 RSS 源,订阅起来很方便,但除了少量的几本小领域期刊外,整体相关度低、查阅费时费力,获取有效文献的效率低。但是,根据老板的建议和课题组的习惯,我们还是会额外关注一下 Nature、Science 等高影响力的综合期刊,一方面是高质量的论文可能激发我们新的灵感,另一方面是了解一下学术圈的热点研究。

新平台各显身手#

在继续之前,聊聊为什么没有选择其他平台进行文献订阅,如 ResearcherResearchgateSemantic Sc​​holarX-MOL。究其根本是已经习惯了现有的订阅途径,而其可靠性也有保证。

较为传统的学术信息聚合平台,提供了期刊订阅、关键词搜索订阅的功能,但其本质与直接订阅期刊官方 RSS、使用关键词订阅 Scholar Alert 的方式是无异的。我个人判断这类订阅方式在广度上比不过背靠搜索引擎的 Google Scholar、精准度上难以匹敌精心维护的 Web of Science。

作为新势力的代表,Semantic Sc​​holar 自称 AI 驱动的科学文献研究工具,可以基于收藏的论文,使用推荐算法将相关的论文推荐给你,其推荐的论文是可能超出施引与被引范围的,这可能有助于开拓读者的思维,但具体效果如何,我暂时无法给出评价。

image

Researcher & Semantic Sc​​holar

现在,我已经习惯同时使用 Google Scholar、微信、Web of Science 进行学术前沿动态的追踪。但由于平台间的割裂,阅读效率是比较低的,也存在着重要文献漏读的情况。我要做的,就是把这三个订阅源聚合在一起。

学术动态追踪 All in One#

Google Scholar、微信公众号、Web of Science 分别使用邮件订阅、app 订阅和邮件订阅(或网站内浏览)的方式向读者推送消息。用 RSS 将这三个信息源进行整合是一个很好的方式,套用现有的框架,只需要自制 RSS 源

image

学术动态追踪 All in One

我把这三个 RSS 源或 RSS 源自动生成脚本托管在 Github 上,读者可移步以下链接进行查看和部署:

Google Scholar 转聚合订阅#

通过解析 scholaralerts-noreply@google.com 的邮件信息,将论文的标题、作者、摘要、源链接按照 RSS 协议组装好,生成 xml 文件,并由 nginx 托管,即制作好一个 Google Scholar 的 RSS 源。在 Scholar-to-RSS 中,读取的收件邮箱为 Outlook 邮箱,可以在 Google Scholar Alerts 页面设置 Outlook 为接收邮箱;也可以在其它邮箱内接收,把发件人为 scholaralerts-noreply@google.com 的邮件转发至 outlook 邮箱。需要读者自行生成 Outlook 的 API Token,具体方法参考项目文档。

Web of Science 转聚合订阅#

Web of Science 的订阅可以通过邮件获取,也可以通过登录后的 Web of Science 主页读取,点击邮件内的链接会进行重定向,速度不如在主页上点击获取。我们使用自动化网页的方式读取订阅主题,并下载推送文献的详细信息。解析论文的标题、作者、摘要、DOI 链接、自动完成标题和摘要的翻译,按照 RSS 协议组装好,生成 xml 文件,并由 nginx 托管,即制作好一个 Web of Science 的 RSS 源。在解析的过程中,同时将数据保存 / 读取为 sqlite 数据库,通过 DOI 进行查重,避免重复的推送

由于 Web of Science 的访问限制,设置了两种模式,一是校内模式,即 IP 订阅了 Clarivate 的相关服务,可直接访问,二是校外模式,即 IP 未订阅 Clarivate 的相关服务,需通过中国教育和科研计算机网联邦认证与资源共享基础设施(CARSI) 认证进行访问。

配置 WoS-to-RSS,需要 Web of Science 登录邮箱与密码,对于校外模式的访问者,还需配置所在高校以及统一认证方式(学号,密码)。

image

Google Scholar, WoS in Feedme

微信公众号转聚合订阅#

微信公众号的订阅是一个老大难的问题。为项目安全考虑,未考虑公开详细的技术路线,请读者在《家庭服务器 Home Server 实践》寻找实现功能的关键词,请注意,没有开箱即用方法。

当然,读者不会空手而归,在 Wechat-Scholar 中,我提供了免费的微信公众号订阅源,但只提供学术类微信公众号转 RSS 服务。何为学术类公众号?我定义为主打学术资讯、论文分享、高质量科普的公众号。时效性方面,Wechat-Scholar 每日 7 am 和 14 pm 更新,保留最新 20 条(或近 7 日)的内容。如果列表中找不到您需要的公众号,可发起 Issues 请求添加。此外,Wechat-Scholar 不提供全文输出,请在 RSS 客户端获取全文。

image

Wechat in Feedme

聚合订阅与过滤#

Google Scholar 和 Web of Science 的推送质量完全取决于我们预设的跟踪内容,滥用跟踪会导致有价值的文献被稀释,这要求我们细心维护跟踪条目。

跟踪有三大类:引文跟踪、检索跟踪、作者跟踪 。2

最近发现 WoS 上线了第四种分类 Recommendations alert: Alert will email you once a month with personalized article recommendations. 推荐算法未知,作者尚未使用

在 Google Scholar 中,我只设置了作者跟踪。Web of Science 中设置全部三类跟踪,引文跟踪的关键在于找到领域内的开山祖师式或里程碑式论文,随着时间的推移,里程碑式论文需要适时更新;检索跟踪关键在于关键词的设定,一般是领域中公认的专业名词组合或缩写组合;作者跟踪,可以把领域内相关的学者全部选定。

image

Web of Science 跟踪订阅

将微信公众号转换为聚合订阅后,会被其海量的信息淹没,做好信息的过滤配置是必要的。我通过关键词进行分类 / 过滤,如「荐号」「面试」「年薪」「招聘」「预约」「会议」「通知」等等。

image

TTRSS 中的过滤与预定义标签

阅读与沉淀#

在仅支持移动端的 RSS 阅读器内阅读文献是不现实的,我推荐选择跨平台的 RSS 阅读器。在食堂排队时、通勤时、如厕时,随时随地粗读摘要,做好筛选收藏后,在「生产力平台」再进行进一步的知识沉淀。

结语#

我们利用聚合订阅实现了学术前沿追踪的 All in One,在统一的入口内,能集中地浏览学术资讯。

对科研大佬而言,这些可能只是雕虫小技,但希望这些小工具能帮到在一线忙碌的科研人。

> 关注 少数派公众号,解锁全新阅读体验 📰

> 实用、好用的 正版软件,少数派为你呈现 🚀

  • 1 也可以在 WoS 个人主页上进行访问。
  • 2 最近发现 WoS 上线了第四种分类 Recommendations alert: Alert will email you once a month with personalized article recommendations. 推荐算法未知,作者尚未使用

Google Scholar、微信公众号和 Web of Science

© 本文著作权归作者所有,并授权少数派独家使用,未经少数派许可,不得转载使用。

加载中...
此文章数据所有权由区块链加密技术和智能合约保障仅归创作者所有。