nvidia-smi
命令查看支持的 CUDA 版本,再去官网下载对应版本。AMD 显卡的话,需要安装 Rocm 驱动和 MNN 框架。Python 环境建议用 3.10 以上版本,虚拟环境可以用 conda 创建,命令是conda create -n glm_test python=3.10
。chatglm2-6b-int4
;另一种是在代码中修改加载方式,把model = AutoModelForCausalLM.from_pretrained(...)
改成model = AutoModelForCausalLM.from_pretrained(...,quantization_bit=4)
。torch.utils.checkpoint.checkpoint
函数包裹模型层就行。比如把output = self.layer(input)
改成output = checkpoint(self.layer, input)
。不过要注意,第一层不能用梯度检查点,不然会影响参数更新。top_p
和temperature
参数也能优化显存。top_p
设为 0.7 时,模型会选择概率超过 70% 的词,生成更准确;设为 0.3 时,生成更多样,但显存占用可能增加。temperature
设为 0.05,模型会更自信,生成速度更快;设为 0.95,生成更随机,显存占用可能更高。history = []
while True:
query = input("用户:")
response, history = model.chat(tokenizer, query, history=history)
print("ChatGLM:", response)
history
参数会把之前的对话信息传给模型,让模型生成更连贯的回复。tokenizer
的truncate
参数来实现。pip install langchain chatglm-cpp
from langchain.llms import ChatGLM
from langchain.tools import Tool
llm = ChatGLM(endpoint_url="http://127.0.0.1:8000")
tool = Tool(
name="WeatherTool",
func=get_weather,
description="查询天气,参数为城市名称"
)
from langchain.chains import SimpleSequentialChain
chain = SimpleSequentialChain(llm=llm, tools=[tool])
response = chain.run("北京明天的天气怎么样?")
print(response)
import fastllm
model = fastllm.ChatGLM("chatglm3-ggml.bin")
response = model.chat("你好")
nvcc -V
查看 CUDA 版本,用torch.version.cuda
查看 PyTorch 使用的 CUDA 版本。要是不匹配,重新安装对应版本的 PyTorch。eval()
函数解析参数,或者手动解析 AST。要是工具返回错误,检查工具代码和 API 接口是否正常。📱 手机端操作篇:2025 年公众号写作赚钱全攻略 🚀 手机注册与基础设置 2025 年微信公众号注册流程大幅简化,现在用手机就能完成全部操作。打开微信,点击右上角「+」号,选择「添加朋友」,搜索
挑对标账号可不能瞎挑,得看跟自己赛道合不合拍。怎么看合不合拍?看看账号定位、发的内容方向、想吸引的用户跟你是不是差不多。就说你做美妆赛道吧,那对标账号也得是专心搞美妆的,发的内容是化妆教程、产品评测这
📌广告变现:新手最易上手的「保底选项」刚起步的公众号,广告变现几乎是绕不开的选择。只要粉丝数达到几千,就会有广告主找上门,不管是文末贴片广告还是文中植入,操作起来都不复杂。这种模式的核心是流量变
📌 内容团队的协作,到底卡在哪里? 做内容的都知道,团队协作最头疼的不是写不出来东西,是沟通成本能把人耗死。你改一版我改一版,最后文档里堆着十几个 “最终版”,真要找最初的灵感反而翻不到了。审稿的时
📊 如何用 AI 分析爆款短剧,并模仿其风格进行创作?现在打开任何一个短视频平台,刷三条内容就大概率会刷到短剧。那些动辄播放量破亿、单集点赞超百万的爆款,背后藏着一套可复制的创作逻辑。但靠人工拆解
AI 写剧本的赚钱逻辑是什么?深度剖析短剧行业的盈利模式 短剧行业这几年可太火了,尤其是搭上 AI 技术的快车后,赚钱的路子一下子就变宽了。好多人都想知道,用 AI 写剧本到底咋赚钱,短剧行业又有哪些
🎥 AI 生成视频怎么赚钱?2025 最新商业模式与实操教程 2025 年,AI 生成视频早已不是新鲜事,但真正能靠这门技术赚到钱的创作者,都摸清了一套底层逻辑。从个人博主到企业品牌,从内容生产到商
欧洲数据门户移动端优化:2025 最新移动数据查询指南 ? 欧洲数据门户的移动端现状与挑战 欧洲数据门户作为欧盟国家公共数据的核心枢纽,整合了各国数据目录的元数据,支持单点访问海量开放数据。不过从 2