引言
随着人工智能(AI)技术的飞速发展,越来越多的AI工具被集成到日常开发流程中,极大地提升了生产力。今天,我们将深入探讨 Google Gemini CLI,一个由 Google Gemini 团队开发的强大开源命令行AI工具。它专为开发者、DevOps 工程师和数据分析师设计,旨在通过自然语言指令简化复杂的编程与运维任务。
本文将详细介绍如何安装、配置并开始使用 Gemini CLI,揭示其核心功能和使用技巧,帮助您将 AI 的力量融入到命令行工作流中。
什么是 Google Gemini CLI?
Google Gemini CLI 是一个基于 Google Gemini 大模型构建的开源命令行界面工具,它将 Gemini 强大的 AI 能力带到您的终端。
GitHub 项目地址: https://github.com/google-gemini/gemini-cli
Gemini CLI 的核心价值在于其能够理解代码、执行复杂查询、自动化重复性任务,并利用 Gemini 的多模态能力(如图像识别)生成创意内容。
核心功能亮点
- 大型代码库支持: 能够处理超过100万个上下文令牌(context tokens),这意味着它可以轻松分析和理解大型项目和复杂的代码库。
- 多模态应用原型: 具备快速从非结构化数据(如 PDF 文档、草图或图片)中提取信息并生成应用原型的能力,加速产品设计与迭代。
- 自动化 DevOps 任务: 能够执行常见的 DevOps 操作,例如自动化 Git 操作、获取 Pull Request (PR) 信息、创建迁移计划等,显著提高运维效率。
- 工具集成: 通过 MCP 服务器,可以连接并利用 Google 的其他媒体生成模型,如 Imagen(图像生成)、Veo(视频生成)和 Lyria(音乐生成),拓展其应用范围。
- 内置网页搜索: 确保 AI 响应的及时性和准确性,提供最新的信息支持。
Google Gemini CLI 安装指南
本指南以 macOS 系统为例,但在 Windows 或 Linux 上步骤类似,所有操作均在终端或命令行中完成。
先决条件
在安装 Gemini CLI 之前,请确保您的系统已安装 Node.js 18 或更高版本。您可以通过运行以下命令来检查当前 Node.js 版本:
node -v
如果版本不符合要求,请先升级 Node.js。
安装方式
有两种主要方式可以安装和运行 Gemini CLI:
选项 1: 直接运行 (无需全局安装)
此方法适用于希望快速尝试或避免全局安装的用户。每次使用时,您需要直接通过 npx
执行:
npx https://github.com/google-gemini/gemini-cli
这种方式会在运行时从 GitHub 下载并执行 CLI,不会在您的系统上留下持久的安装文件。
选项 2: 全局安装 (推荐)
对于频繁使用的用户,推荐进行全局安装。这使得您可以在任何目录下直接通过 gemini
命令启动 CLI。在您的终端中运行以下命令:
sudo npm install -g @google/gemini-cli
请注意,如果使用 sudo
,系统可能会提示您输入管理员密码。
安装完成后,只需在终端中输入 gemini
即可启动交互式 CLI。首次运行时,它可能会请求一些必要的权限,请按照提示确认以继续。
首次配置 Gemini CLI
首次启动 Gemini CLI 后,它将引导您完成一系列简短的设置步骤。
步骤 1: 选择主题
CLI 会提供多个主题样式供您选择。根据您的喜好,选择一个主题后按 Enter 键确认。
2. 步骤 2: 选择登录方式
选择您希望用于访问 Gemini API 的登录方式。推荐使用 “Login with Google” 选项,它通常提供免费额度,支持 每分钟60次请求 和 每天1000次请求,足以满足大多数个人开发需求。选择后按 Enter。
如果您需要更高的请求限制、企业级访问或偏好使用 API 密钥,可以执行以下操作:
-
首先,从 Google AI Studio 获取您的专属 API 密钥。
-
然后,将其设置为环境变量。这通常在您的
.bashrc
、.zshrc
或.profile
文件中完成:export GEMINI_API_KEY="YOUR_API_KEY"
注意: 使用 API 密钥 通常用于直接的 API 调用场景,而本指南主要关注 CLI 的交互式体验。
3. 步骤 3: 浏览器认证
在您选择“Login with Google”后,系统会自动打开一个浏览器窗口。请使用您的 Google 账号完成登录和授权。
登录成功后,您将在浏览器中看到确认信息,表示 Gemini CLI 已成功认证。此时,您可以回到终端,开始使用 Gemini CLI。
开始使用 Gemini CLI
现在,一切准备就绪!您可以在 CLI 中直接输入提示词,与 Gemini 进行交互。
例如,您可以直接输入一个问题或指令:
> Explain what is a LLM?
Gemini CLI 提示示例:
上传和引用本地文件
Gemini CLI 支持处理本地文件。要在 CLI 中上传并引用文件,请使用 @
符号触发文件选择界面:
> Analyze this document: @
输入 @
后,CLI 将引导您选择本地文件,并将其内容发送给 Gemini 进行分析或处理。
Gemini CLI 文件上传示例:
在 VSCode 中使用 Gemini CLI
您也可以直接在 VS Code 的集成终端中运行 gemini
命令。启动后,使用 @
命令选择文件并开始对话,与在独立终端中的体验一致。
例如,您可以在 VS Code 终端中输入:
> Help me write a simple calculator in Python
CLI 可能会在过程中请求“写入权限”,这通常是为了允许 Gemini 生成的代码或其他内容写入到文件系统,请确认。
使用技巧与注意事项
- 模型回退: 如果网络连接不稳定或 Gemini CLI 遇到暂时性问题,它可能会自动从更强大的
gemini-2.5-pro
模型回退到速度更快的gemini-2.5-flash
模型,以确保服务的持续性。 - 查看可用命令: 要查找 Gemini CLI 中可用的命令和使用提示,只需在 CLI 交互界面中输入
/
即可。这将显示一个帮助菜单,指导您探索更多功能。
Gemini CLI 是开发者、DevOps 工程师和数据分析师的强大 AI 助手,它通过自然语言指令简化代码分析、自动化工作流程并支持创意生成,是提升工作效率的利器。
关于
关注我获取更多资讯

