• 两行代码解决大语言模型对话局限!港中文贾佳亚团队联合MIT发布超长文本扩展技术

    代码和Demo地址:https://github.com/dvlab-research/LongLoRA论文地址:https://arxiv.org/pdf/2309.12307.pdf中途迷失、模型偷懒、上下文越长大模型越笨……如果体验过大语言模型产品,用户多少会对文本输入长度带来的限制有所感触,比如当想和大模型讨论一些稍长的内容,需要拆分输入,而前面输入的要点,很快就会被大模型忘记。这是典型的大语言模型对话缺陷!就像先天有注意力缺陷的儿童,难以专注看完一本新书

    2023-10-11