Consensus is a search engine that uses AI to find insights in research papers

长期以来,寻找经过审查的、公正的信息一直是一个艰巨而痛苦的过程。我们相信,如果使用周到、谨慎和优雅,人工智能最终可以改变这个等式。

无论您是终身研究人员还是日常消费者,我们的目标都是成为您寻找专业知识的首选来源。

什么是Consensus ?
Consensus是一个搜索引擎,它使用语言模型来呈现论文,并从学术研究论文中综合见解。Consensus不是聊天机器人,但我们在整个产品中使用了相同的技术,以帮助提高研究过程的效率。

Consensus search的是什么?
目前共识中使用的原始材料来自Semantic Scholar数据库,该数据库包括所有科学领域的2亿多篇论文。

Consensus search是如何工作的:
在执行搜索之前:
我们在整个研究论文的语料库上运行一个定制的微调语言模型,并从每篇论文中提取“关键要点”。

步骤1:
用户在搜索栏中输入查询。

然后,我们从查询中删除“停止词”(如“什么”,“是”,“是”等),并对所有论文的摘要和标题进行关键词搜索+向量搜索的组合。这为我们提供了一个非常智能的度量文档与用户查询的相关性。

步骤2:
然后,这个相关性评分与许多其他元数据(包括但不限于引用次数、引用速度、研究设计和发布日期)相结合,对结果进行重新排序,并产生前20个可能的结果。

步骤3:
如果用户在搜索引擎中输入一个问题或“短语”(比如“正念的好处”),我们就会运行一个定制的微调语言模型,根据用户的查询和给定论文的摘要生成“与问题相关的结论”。如果用户输入关键字搜索或任何其他未分类的查询类型,我们使用提前提取的“关键提取”(见上文)。

步骤4:
有了这个包含20个结果的新列表(要么是生成的结论,要么是“关键输出”),然后我们运行一个最终定制的微调语言模型,该模型是为问答而构建的,根据它们对用户查询的处理程度对结果进行排名。该语言模型决定了结果在搜索屏幕上显示的最终顺序。

步骤5:
如果你在搜索引擎中输入了一个问题或一个“短语”,并且结果被认为是足够相关的,那么我们就会对前10个结果运行OpenAI的GPT-4模型,为你提供一个简单的一句话摘要,其中包含了与你的问题相关的最重要的研究。生成的摘要可以在左上角的“summary”框中看到。

如果你在搜索引擎中输入了一个“是”或“否”的问题,并且结果被认为是足够相关的,那么我们就会运行一个定制的微调LLM,将结果分类为“是”、“否”或“可能”
的问题。

该模型的汇总结果可以在结果页面右上角的“Consensus Meter”中看到。

consensus

相关导航

暂无评论

暂无评论...