清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
清华大学与加州大学圣地亚哥分校(UCSD)的研究人员最近提出了一种创新的微调方法,该方法通过智能工具使用适应,显著提高了大型语言模型(LLM)在解决科学问题时的性能。这种方法不仅在解决复杂科学问题上取得了显著进展,还保持了模型在解决简单问题上的基本推理能力。 传统的方法中,LLM在解决...
商汤、清华、复旦等开源百亿级多模态数据集,可训练类GPT-4o模型
近日,商汤科技、清华大学、复旦大学等机构联合开源了一个名为OmniCorpus的多模态数据集,其规模达到了惊人的百亿级。这一数据集的发布,有望为训练类似GPT-4级别的大型多模态模型提供有力支持。 OmniCorpus数据集由多个图像和文本组成,以自然文档的形式排列,这种图像-文本交错的数据形式与互联网数据的呈现方式相一致&#...
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
近日,清华大学联合多家机构发布了一项名为MultiTrust的多模态评估研究,旨在全面评估多模态大型语言模型(MLLMs)的可信度。这项研究由清华大学计算机系的Yichi Zhang、Yao Huang、Yitong Sun等学者共同完成,并得到了来自北京航空航天大学、上海交通大学等机构的支持。 MultiTrust是第一个全...
清华开了家员工都是GPT的公司,代码、文档一条龙服务
我们都知道以 ChatGPT 为代表的大型语言模型(LLM)具备代码生成能力,毕竟代码本身也是一种语言。近日,清华大学孙茂松团队不只是让 LLM 当程序员,还更进一步,基于 LLM 开发出了一家「虚拟软件开发公司」ChatDev。这家公司的各个职员都是 LLM,能端到端地完成从分析需求到写代码再到文档制作的整个软件开发流程,实现软件开发一条龙服务。理想情况下,基于该框架,用户只需提个需求,就能收....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。