
会员
从零开始大模型开发与微调:基于PyTorch与ChatGLM
更新时间:2024-12-31 17:38:36
最新章节:18.5 本章小结开会员,本书免费读 >
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
同类热门书
最新上架
- 会员
通用人工智能标准、评级、测试与架构
本书聚焦通用人工智能的学科内涵与发展趋势,以一套基于“能力与价值双系统”的通用人工智能认知架构与测试模式为核心,梳理形成“一个定义、两个完备性、三个特征、八个关键问题”的理论框架。本书共6章,从人工智能的历史、内涵与哲学基础切入,依次介绍通用人工智能的定义与特征、测试与评级、训练与测试平台,以及TongAI理论框架,最后给出对发展通用人工智能的建议。本书既有助于科技领域的管理者和投资者提纲挈领,把计算机16.4万字 智能汽车软件功能安全
这是一本从实践角度系统且深入地讲解智能汽车软件功能安全和智能汽车软件研发的著作,得到了中国工程院院士李克强等13位产业界和学术界专家的一致推荐。作者在功能安全领域深耕10余年,有扎实的理论基础、丰富的实践经验,用挖掘本质的思维方法来撰写本书,从研发体系、架构设计、开发流程、开发方法、安全措施、创新研究等维度对智能汽车软件功能安全做了深入的讲解。全书共11章,分为3个部分。第一部分(第1~3章)智能计算机25.9万字- 会员
秒懂AI辅助论文写作
本书是一本深入探讨AI在论文写作中应用的指南。本书通过九章内容,全面介绍如何在论文选题、前言写作、大纲写作、正文写作、数据分析、摘要写作、结语撰写、文稿翻译与润色、答辩PPT制作、查重投稿等环节借助AI提高效率和质量。本书不仅讨论了AI的使用伦理,还针对论文写作的具体问题,提供了提示词示例(已全部收录到秋叶AI智能鼠标平台),为论文写作提供了广阔的视角和新的方法。本书可作为缺少学术论文写作经验的大计算机7.3万字 - 会员
大模型工程化:AI驱动下的数据体系
大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、计算机15.6万字 - 会员
如何教人工智能说人话?
AI的本质是什么?自然语言和人工语言的区别在哪里?ChatGPT究竟是人工智能发展道路上的里程碑,还是某种误入歧途的“假AI”?我们不许诺美丽空洞的AI前景,而是告诉读者,未来的AI之路到底有多少激流险滩——对于统计学工具与硬件升级的片面崇拜,对于智能科学基本原理的蔑视,是目前AI研究的大危机。在我们看来,万众期待的ChatGPT,只是新时代的“牛顿炼金术”。计算机17.8万字 - 会员
设计深度学习系统
本书主要从软件开发者的角度探讨如何构建和设计深度学习系统。作者首先描述一个典型的深度学习系统的整体,包括其主要组件以及它们之间的连接方式,然后在各个单独的章节中深入探讨这些主要组件。对于具体介绍的章节,会在开始时讨论需求,接着介绍设计原则和示例服务/代码,并评估开源解决方案。通过阅读本书,读者将能够了解深度学习系统的工作原理,以及如何开发每个组件。本书的主要读者对象是想要从事深度学习平台工作或将一计算机18.1万字 - 会员
这就是DeepSeek:普通人如何抓住AI红利
本书聚焦如何高效运用DeepSeek这一前沿AI工具,帮助读者在技术浪潮中把握机遇。全书从DeepSeek发展历程切入,系统解析DeepSeek在信息处理、创意生成与决策辅助中的核心能力,并结合生活管理、职场协作、学习优化、社交互动等场景,通过真实案例讲解其应用方法。同时,针对内容创作、自媒体运营、副业变现等需求,书中提供了可落地的策略与案例,助力读者实现效率提升与价值创造。书中不仅提供技术使用技计算机5.5万字 - 会员
DeepSeek原理与项目实战:大模型部署、微调与应用开发
DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合计算机17.1万字 - 会员
人工智能算法基础
本书分为4章,共20章。其中第1篇为基础算法篇,从第1章到第9章,讲述排序、查找、线性结构、树、散列、图、堆栈等基本数据结构算法;第2篇为机器学习算法篇,从第10章到第14章,讲述分类算法、回归算法、聚类算法、降维算法和集成学习算法;第3篇为强化学习算法篇,从第15章到第16章,讲述基于价值的强化学习算法和基于策略的强化学习算法;第4篇为深度学习算法篇,从第17章到第19章,讲述神经网络模型算法、计算机0字