AI百科-聚客AI-引领 AI 大模型研发_人才孵化_应用开发与落地服务的行业先锋-

首页

聚客学院

解决方案

新闻中心

关于我们

心之所向素履以往

聚客AI累计更新百余次，每一次的完善背后都离不开所有技术人员的辛勤付出

人工智能中的Agent，也称为智能体（Intelligent Agent），是一种具有自主性、目标导向、学习能力和逻辑推理能力的软件实体或硬件实体。

RAG技术深度解析：2025年架构演进与实战经验沉淀

2025-03-28本站

引言：从技术实践到行业共识的RAG演进之路在2023年之前，RAG（检索增强生成）的核心技术——检索增强（Retrieval-Augmented）已在智能问答系统中广泛应用，但直到大模型（LLM）的爆发式增长，RAG才真正成为企业级AI落地的核心范式。2024年，随着技术细节的深度优化与行业需求的碰撞，RAG技术逐渐从“架构探索”转向“工程化

解剖Transformer核心：手撕大模型灵魂架构

2025-03-27本站

一、Transformer Embeddings过程深度解析1.1 语义空间的数学投影Transformer的embedding过程是将离散符号（如单词、子词）映射到连续向量空间的核心操作。与传统词嵌入（如Word2Vec）不同，Transformer的embedding层具有以下特性：动态上下文感知：通过后续的注意力机制实现上下文相关表示高维空间映射：典型维度为512/768/

聚客AI万字长文让你读懂 RAG 架构：从基础模式迈向高级应用

2025-03-26本站

在人工智能飞速发展的当下，RAG（Retrieval-Augmented Generation）技术凭借独特优势脱颖而出，成为众多应用的关键支撑。它在 AI 生成过程中引入外部知识检索，极大提升了 AI 回答的准确性与全面性，从基础架构衍生出多种高级模式，广泛应用于多个领域。一、RAG 架构核心组件RAG 架构主要包含嵌入模型、生成模型、重排序模型

RAGFlow：从 0 到 1教你搭建RAG知识库

2025-03-25本站

1. RAGFlow概述RAGFlow是基于检索增强生成（Retrieval-Augmented Generation）技术的开源知识库解决方案，能够快速将非结构化文档（PDF、Word、Markdown等）转化为可检索的知识库，并通过大模型实现精准问答。其核心优势包括：自动文本解析：支持复杂格式文档（表格、公式、代码块）的智能解析；精准检索：结合语义匹配和关

DeepSeek-R1如何用1/30成本实现97%推理精度？万字长文解码大模型「降本增效」终极之战

2025-03-24本站

1. 什么是语言模型 (Language Models)？语言模型（Language Models, LMs）是预测序列数据（如文本）概率分布的数学模型。其核心任务是给定前文预测下一个词的概率。1.1 大型语言模型（LLMs）LLMs是参数量超过亿级的语言模型，通过海量数据预训练获得通用语言理解能力。例如，GPT-3（1750亿参数）能够生成连贯文本、翻译语言

置顶热文

聚客AI受邀参加第八届信息技术产学合作论坛峰会

近日，由中国软件行业协会、信息技术新工科产学研联盟主办，湖南大学信息科技与工程学院协办的“第八届信息技术新工科产学研联盟年会暨信息技术领域产学合作论坛”在长沙碧桂园酒店圆满落幕。本次大会邀请了来自全国各地信息技术领域的专家学者，联盟工委成员高校及成员企业代表等共计300多人参加本次会议。会议以聚焦人工智

人工智能的Agent是什么？

人工智能中的Agent，也称为智能体（Intelligent Agent），是一种具有自主性、目标导向、学习能力和逻辑推理能力的软件实体或硬件实体。

聚客Ai旗下聚客学院首期线上交流峰会圆满举行并被多家媒体报道

3月1日晚，湖南光聚客网络科技有限公司（以下简称“聚客AI”）旗下聚客AI学院主办的首期线上交流分享峰会圆满收官。本次峰会以“AI人才生态与展望AI未来”为主题，吸引超千人次在线参与。作为响应国家“人工智能+”行动号召的重要实践，峰会不仅聚焦人才成长，更深度融入地方政策导向与行业趋势，彰显聚客AI在推动AI技术进步

AI大模型助力自动驾驶渗透率将加速提升

新年伊始，不少产业链企业就围绕自动驾驶展开布局。在2025年国际消费电子展（简称“CES 2025” ）上，英伟达与丰田等巨头宣布将合作开发“下一代汽车”，这些汽车将提供安全、先进的驾驶辅助功能。索尼集团与本田的合资企业索尼·本田移动出行正式发布了双方合作开发的首款电动车Afeela，该款汽车引入AI自动驾驶辅助功能。

DeepSeek开源战略掀起AI产业革命：技术透明化与生态重构

开源浪潮推动技术民主化人工智能领域正经历着从封闭到开放的历史性转折。继上个月推出支持MIT许可证的开放权重模型后，DeepSeek于2月24日启动"开源周"，计划连续5天发布5个核心代码库。首日开源的FlashMLA加速库引发行业震动，该工具针对Hopper GPU优化，在H800上实现3000GB/s内存带宽，通过动态序列处理技术将推