consensus

Consensus is a search engine that uses AI to find insights in research papers

长期以来，寻找经过审查的、公正的信息一直是一个艰巨而痛苦的过程。我们相信，如果使用周到、谨慎和优雅，人工智能最终可以改变这个等式。

无论您是终身研究人员还是日常消费者，我们的目标都是成为您寻找专业知识的首选来源。

什么是Consensus ?
Consensus是一个搜索引擎，它使用语言模型来呈现论文，并从学术研究论文中综合见解。Consensus不是聊天机器人，但我们在整个产品中使用了相同的技术，以帮助提高研究过程的效率。

Consensus search的是什么?
目前共识中使用的原始材料来自Semantic Scholar数据库，该数据库包括所有科学领域的2亿多篇论文。

Consensus search是如何工作的:
在执行搜索之前:
我们在整个研究论文的语料库上运行一个定制的微调语言模型，并从每篇论文中提取“关键要点”。

步骤1:
用户在搜索栏中输入查询。

然后，我们从查询中删除“停止词”(如“什么”，“是”，“是”等)，并对所有论文的摘要和标题进行关键词搜索+向量搜索的组合。这为我们提供了一个非常智能的度量文档与用户查询的相关性。

步骤2:
然后，这个相关性评分与许多其他元数据(包括但不限于引用次数、引用速度、研究设计和发布日期)相结合，对结果进行重新排序，并产生前20个可能的结果。

步骤3:
如果用户在搜索引擎中输入一个问题或“短语”(比如“正念的好处”)，我们就会运行一个定制的微调语言模型，根据用户的查询和给定论文的摘要生成“与问题相关的结论”。如果用户输入关键字搜索或任何其他未分类的查询类型，我们使用提前提取的“关键提取”(见上文)。

步骤4:
有了这个包含20个结果的新列表(要么是生成的结论，要么是“关键输出”)，然后我们运行一个最终定制的微调语言模型，该模型是为问答而构建的，根据它们对用户查询的处理程度对结果进行排名。该语言模型决定了结果在搜索屏幕上显示的最终顺序。

步骤5:
如果你在搜索引擎中输入了一个问题或一个“短语”，并且结果被认为是足够相关的，那么我们就会对前10个结果运行OpenAI的GPT-4模型，为你提供一个简单的一句话摘要，其中包含了与你的问题相关的最重要的研究。生成的摘要可以在左上角的“summary”框中看到。

如果你在搜索引擎中输入了一个“是”或“否”的问题，并且结果被认为是足够相关的，那么我们就会运行一个定制的微调LLM，将结果分类为“是”、“否”或“可能”
的问题。

该模型的汇总结果可以在结果页面右上角的“Consensus Meter”中看到。

暂无评论

暂无评论...