心之所向 素履以往
聚客AI累计更新百余次,每一次的完善背后都离不开所有技术人员的辛勤付出
人工智能的Agent是什么?
2025-01-25本站
人工智能中的Agent,也称为智能体(Intelligent Agent),是一种具有自主性、目标导向、学习能力和逻辑推理能力的软件实体或硬件实体。
RAG技术深度解析:2025年架构演进与实战经验沉淀
2025-03-28本站
引言:从技术实践到行业共识的RAG演进之路在2023年之前,RAG(检索增强生成)的核心技术——检索增强(Retrieval-Augmented)已在智能问答系统中广泛应用,但直到大模型(LLM)的爆发式增长,RAG才真正成为企业级AI落地的核心范式。2024年,随着技术细节的深度优化与行业需求的碰撞,RAG技术逐渐从“架构探索”转向“工程化
解剖Transformer核心:手撕大模型灵魂架构
2025-03-27本站
一、Transformer Embeddings过程深度解析1.1 语义空间的数学投影Transformer的embedding过程是将离散符号(如单词、子词)映射到连续向量空间的核心操作。与传统词嵌入(如Word2Vec)不同,Transformer的embedding层具有以下特性:动态上下文感知:通过后续的注意力机制实现上下文相关表示高维空间映射:典型维度为512/768/
聚客AI万字长文让你读懂 RAG 架构:从基础模式迈向高级应用
2025-03-26本站
在人工智能飞速发展的当下,RAG(Retrieval-Augmented Generation)技术凭借独特优势脱颖而出,成为众多应用的关键支撑。它在 AI 生成过程中引入外部知识检索,极大提升了 AI 回答的准确性与全面性,从基础架构衍生出多种高级模式,广泛应用于多个领域。一、RAG 架构核心组件RAG 架构主要包含嵌入模型、生成模型、重排序模型
RAGFlow:从 0 到 1教你搭建RAG知识库
2025-03-25本站
1. RAGFlow概述RAGFlow是基于检索增强生成(Retrieval-Augmented Generation)技术的开源知识库解决方案,能够快速将非结构化文档(PDF、Word、Markdown等)转化为可检索的知识库,并通过大模型实现精准问答。其核心优势包括:自动文本解析:支持复杂格式文档(表格、公式、代码块)的智能解析;精准检索:结合语义匹配和关
DeepSeek-R1如何用1/30成本实现97%推理精度?万字长文解码大模型「降本增效」终极之战
2025-03-24本站
1. 什么是语言模型 (Language Models)?语言模型(Language Models, LMs)是预测序列数据(如文本)概率分布的数学模型。其核心任务是给定前文预测下一个词的概率。1.1 大型语言模型(LLMs)LLMs是参数量超过亿级的语言模型,通过海量数据预训练获得通用语言理解能力。例如,GPT-3(1750亿参数)能够生成连贯文本、翻译语言
置顶热文
1
人工智能中的Agent,也称为智能体(Intelligent Agent),是一种具有自主性、目标导向、学习能力和逻辑推理能力的软件实体或硬件实体。
2
3月1日晚,湖南光聚客网络科技有限公司(以下简称“聚客AI”)旗下聚客AI学院主办的首期线上交流分享峰会圆满收官。本次峰会以“AI人才生态与展望AI未来”为主题,吸引超千人次在线参与。作为响应国家“人工智能+”行动号召的重要实践,峰会不仅聚焦人才成长,更深度融入地方政策导向与行业趋势,彰显聚客AI在推动AI技术进步
3
新年伊始,不少产业链企业就围绕自动驾驶展开布局。在2025年国际消费电子展( 简称“CES 2025” )上,英伟达与丰田等巨头宣布将合作开发“下一代汽车”,这些汽车将提供安全、先进的驾驶辅助功能。索尼集团与本田的合资企业索尼·本田移动出行正式发布了双方合作开发的首款电动车Afeela,该款汽车引入AI自动驾驶辅助功能。
4
开源浪潮推动技术民主化人工智能领域正经历着从封闭到开放的历史性转折。继上个月推出支持MIT许可证的开放权重模型后,DeepSeek于2月24日启动"开源周",计划连续5天发布5个核心代码库。首日开源的FlashMLA加速库引发行业震动,该工具针对Hopper GPU优化,在H800上实现3000GB/s内存带宽,通过动态序列处理技术将推
5
2025年2月16日,聚客AI公司官网线上试运营启动仪式在公司总部隆重举行,标志着聚客AI在AI人工智能大模型研发和人才孵化领域迈出了坚实的一步,也预示着公司业务发展进入了一个崭新的阶段。
聚客学院已正式上线立即体验