Skip to content

Commit

Permalink
✨ feat: update 2024-06-30 section
Browse files Browse the repository at this point in the history
  • Loading branch information
Jiacheng787 committed Jun 30, 2024
1 parent cd061c3 commit 772e857
Showing 1 changed file with 36 additions and 12 deletions.
48 changes: 36 additions & 12 deletions blogs/2024/2024-06-30/index.md
Original file line number Diff line number Diff line change
Expand Up @@ -43,29 +43,53 @@ tags: []

:::

[2024稀土开发者大会精彩亮点|代码不止 掘金不停](https://mp.weixin.qq.com/s/BesgaZ-Dj0DosZks1mvuRg)
- [2024稀土开发者大会精彩亮点|代码不止 掘金不停](https://mp.weixin.qq.com/s/BesgaZ-Dj0DosZks1mvuRg)
- 本文作者介绍了在2024稀土开发者大会上,五位技术嘉宾分享了开源生态、新技术发现及应对技术变革的策略,探讨了AI在多媒体内容生成、教育等领域的应用,以及如何通过开放生态系统推动企业人工智能的发展。
- 演讲嘉宾还讨论了生成式AI对现实世界的影响、AI编程工具的未来发展方向、大模型部署成本降低策略,以及Mistral模型的发展和应用,强调了评估在生成式AI开发过程中的重要性,并探讨了AI基础设施的优化策略。

[Semantic Kernel:微软开源的 LangChain 替代](https://mp.weixin.qq.com/s/ZJTfCkWOrE8omRZEhrj_3g)
- [Semantic Kernel:微软开源的 LangChain 替代](https://mp.weixin.qq.com/s/ZJTfCkWOrE8omRZEhrj_3g)
- 本文作者介绍了微软开源的Semantic Kernel,这是一个轻量级的开源软件开发工具包(SDK),旨在帮助开发者将AI功能集成到应用程序中。它提供了灵活的插件架构、AI驱动的插件编排和多语言支持(C#、Python和Java)。
- 文章详细比较了Semantic Kernel与LangChain的特点和优势,强调了Semantic Kernel在企业级功能、安全性、模块化和自动化业务流程方面的优势,适合构建需要与现有系统集成的企业级AI应用程序。

[陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现](https://mp.weixin.qq.com/s/Me2PCh_-WUwaZK4s3oK-OA)
- [陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现](https://mp.weixin.qq.com/s/Me2PCh_-WUwaZK4s3oK-OA)
- 本文作者陈丹琦团队提出了新的图表任务测试基准CharXiv,涵盖2323张来自arXiv论文的真实图表,旨在更好地评估多模态大模型的图表推理能力。与以往的数据集相比,CharXiv难度更大,问题类型更广泛。
- 研究发现,尽管Claude 3.5 Sonnet在推理任务中表现最好,但也仅仅及格,整体模型在推理问题上的表现仍不理想。描述能力强的模型通常推理能力也强,但反之不一定成立。

[谷歌开源系模型第二代免费开放!27B媲美LLaMA3 70B,单H100或TPU主机可跑](https://mp.weixin.qq.com/s/YtPPIc73rNAiPu-OyMFTYg)
- [谷歌开源系模型第二代免费开放!27B媲美LLaMA3 70B,单H100或TPU主机可跑](https://mp.weixin.qq.com/s/YtPPIc73rNAiPu-OyMFTYg)
- 本文作者介绍了谷歌开源的Gemma 2模型,该模型在27B参数规模下提供了与LLaMA3 70B相媲美的性能,并且可以在单个NVIDIA H100或TPU主机上运行。Gemma 2还包括一个更轻的9B版本,性能同样出色。
- Gemma 2采用了Gemini同款技术架构,具有更高的推理效率和安全性。其关键特点包括交替使用局部滑动窗口注意力和全局注意力机制,以及分组查询注意力(GQA)。此外,谷歌计划在下个月通过Google Cloud的Vertex AI平台提供Gemma 2的部署和管理服务。

[别再被大模型骗了,一个小技巧,让LLaMa3诚信度提升65%](https://mp.weixin.qq.com/s/mS-NhSAb2-T3Ti14HepDAA)
- [别再被大模型骗了,一个小技巧,让LLaMa3诚信度提升65%](https://mp.weixin.qq.com/s/mS-NhSAb2-T3Ti14HepDAA)
- 本文介绍了华中科技大学团队提出的新框架,通过理论和实践提升大语言模型的诚实性和有益性。他们构建了HoneSet数据集,并设计了针对开源和商业模型的优化方法。实验表明,经过两阶段微调后,LLaMa3的诚信度提升了65%。
- 研究重点在于通过提示优化和两阶段微调,使模型在面对不同类型问题时更诚实可靠。该方法在包括GPT-4、ChatGPT和Claude等多个主流模型上均取得了显著成效,展示了其广泛适用性。

[RAG、ROG、RCG傻傻分不清?概念辨识及RCG在SimplyRetrieve中的naive实现](https://mp.weixin.qq.com/s/KxaiKjrsMyy8kh7Sju2oJg)
- [RAG、ROG、RCG傻傻分不清?概念辨识及RCG在SimplyRetrieve中的naive实现](https://mp.weixin.qq.com/s/KxaiKjrsMyy8kh7Sju2oJg)
- 本文介绍了RAG(检索增强型生成)、ROG(检索关闭型生成)和RCG(检索中心型生成)的概念及其区别。RAG结合外部数据和模型内在知识,ROG完全依赖模型内在知识,而RCG强调上下文解释与知识记忆的分离,通过检索器提供知识,语言模型负责解释。
- 文章还讨论了RCG在SimplyRetrieve中的实现,指出尽管RCG方法被认为更清晰和有效,但在实际应用中通过提示词进行简单区分的方法仍存在可行性和泛化性的问题。RCG的实现难点在于明确区分语言模型和检索器的角色。

[Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点](https://mp.weixin.qq.com/s/Zy-kM3bvN-1oHondw1VLzw)
- [Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点](https://mp.weixin.qq.com/s/Zy-kM3bvN-1oHondw1VLzw)
- 本文作者张天宇介绍了由图灵奖得主Yoshua Bengio团队提出的新视觉问答任务“视觉字幕恢复(VCR)”,该任务旨在评估视觉语言模型(VLM)的推理能力。研究表明,现有模型在处理复杂推理任务时仍存在显著差距,尤其是在被遮挡文字的恢复上,模型表现远不及人类。
- 通过构建VCR数据集,研究团队发现大多数模型无法有效利用图像信息来提升准确率,特别是在困难难度下,模型的表现极差。该任务揭示了模型在图像和文本对齐方面的局限性,并为未来多模态模型的训练和评测提供了新的方向。

[Multi-Head RAG:多头注意力的激活层作为嵌入进行文档检索](https://mp.weixin.qq.com/s/OQiRDhRMzwRdF-GHi8-egQ)
- [Multi-Head RAG:多头注意力的激活层作为嵌入进行文档检索](https://mp.weixin.qq.com/s/OQiRDhRMzwRdF-GHi8-egQ)
- 本文由黄继彦介绍了一种新的多头RAG (MRAG)方案,通过利用Transformer模型中的多头注意力层激活,而非传统的前馈层激活来进行文档检索。MRAG能够在不增加存储需求的情况下,捕获数据的多面性,显著提高文档检索的相关性和准确性。
- 实验结果表明,MRAG在检索成功率上比标准RAG提高了10-20%,并且在实际应用中,如法律文件合成和工业事故原因分析中,也展示了其优越性。MRAG通过综合评估和实际用例证明了其有效性和广泛适用性。

[DCGen:一种新的Design-to-Code框架,设计稿转代码有效性大幅提高](https://mp.weixin.qq.com/s/Q4NljU7V9YSfiyycF8s74Q)
- [DCGen:一种新的Design-to-Code框架,设计稿转代码有效性提高](https://mp.weixin.qq.com/s/Q4NljU7V9YSfiyycF8s74Q)
- 本文作者张天宇介绍了DCGen,一个基于分而治之策略的Design-to-Code框架,通过将复杂的设计稿拆分为更小的视觉单元,再利用多模态大模型(MLLM)生成每个单元的代码,最后整合成完整代码。DCGen有效提升了设计稿转代码的准确性和视觉相似性。
- 实验表明,DCGen在视觉相似性和代码相似性方面比传统方法提升了14%,特别是在处理复杂网页设计时表现尤为出色。DCGen的创新在于其分割和组装阶段的递归处理方法,使其在多种复杂度的网站中均表现优异。

[Google 发布最新开放大语言模型 Gemma 2,现已登陆 Hugging Face Hub](https://mp.weixin.qq.com/s/5UHSKB_V5Cdtl4jrWE1aQw)
- [Google 发布最新开放大语言模型 Gemma 2,现已登陆 Hugging Face Hub](https://mp.weixin.qq.com/s/5UHSKB_V5Cdtl4jrWE1aQw)
- 本文由机器之心发布,介绍了Google最新发布的开放大语言模型Gemma 2。该模型有两种规模:90亿参数和270亿参数,分别有基础(预训练)和指令调优版本。Gemma 2基于Google DeepMind的Gemini,拥有8K Tokens的上下文长度,并在Hugging Face Hub上提供四个开源模型。
- Gemma 2在滑动窗口注意力、Logit软上限、知识蒸馏和模型合并方面进行了技术创新。实验结果显示,Gemma 2在多个基准测试中表现优异,特别是在长上下文情况下生成质量显著提高。用户可以在Hugging Chat上体验Gemma 2,并通过Hugging Face Transformers集成进行使用。

[DB-GPT:蚂蚁开源的Text-to-SQL利器](https://mp.weixin.qq.com/s/tP1iLkI5-tcUwmtUqelBKQ)
- [DB-GPT:蚂蚁开源的Text-to-SQL利器](https://mp.weixin.qq.com/s/tP1iLkI5-tcUwmtUqelBKQ)
- 本文由蚂蚁集团介绍了DB-GPT,一个AI原生数据应用开发框架。DB-GPT通过自然语言交互,实现对数据库的高效查询和数据分析,支持多种数据源和大语言模型,并提供私有化部署和数据脱敏功能,确保数据安全。
- DB-GPT的核心特性包括私域问答、数据处理与RAG、向量存储与检索、多源数据连接、生成式商业智能、多模型管理与自动化微调、数据驱动的智能体与插件扩展等,适用于企业内部知识库问答、产品文档智能客服、市场分析、用户画像分析等多种应用场景。

[吴恩达:从 Agent 到 Agentic,超越基础模型的下一代 AI](https://mp.weixin.qq.com/s/Gl74YZn4ylxSHAkwUFB-FA)
- [吴恩达:从 Agent 到 Agentic,超越基础模型的下一代 AI](https://mp.weixin.qq.com/s/Gl74YZn4ylxSHAkwUFB-FA)
- 本文由子非AI发布,介绍了吴恩达在2024年Snowflake峰会上的演讲,探讨了Agentic AI的概念及其潜力。Agentic AI不同于传统的被动AI系统,它赋予AI主动思考、规划和执行任务的能力,通过代理型工作流程(Agentic workflow)来提升AI系统的性能。
- 吴恩达强调,Agentic AI可以在复杂任务中分解步骤并通过迭代优化结果,展现出比下一代基础模型更大的潜力。实验表明,即使是较弱的模型在采用Agentic workflow后也能超越更强的模型,展示了Agentic AI在代码生成和视觉任务等领域的广泛应用前景。

[Florence-2:微软开源的轻量级视觉基础模型,吊打巨型模型!](https://mp.weixin.qq.com/s/VSx4RlyrLYbdDp3IuUF6Cw)

Expand Down

0 comments on commit 772e857

Please sign in to comment.