Google Gemini CLI 教程:命令行AI工具的安装与使用详解

本文详细介绍了 Google Gemini CLI 的安装、首次设置和使用方法,这是一个强大的开源命令行AI工具,旨在帮助开发者、DevOps工程师和数据分析师提升工作效率。文章还探讨了其核心功能、使用技巧,并额外推荐了API开发工具Apidog。

阅读时长: 4 分钟
共 1915字
作者: eimoon.com

引言

随着人工智能(AI)技术的飞速发展,越来越多的AI工具被集成到日常开发流程中,极大地提升了生产力。今天,我们将深入探讨 Google Gemini CLI,一个由 Google Gemini 团队开发的强大开源命令行AI工具。它专为开发者、DevOps 工程师和数据分析师设计,旨在通过自然语言指令简化复杂的编程与运维任务。

本文将详细介绍如何安装、配置并开始使用 Gemini CLI,揭示其核心功能和使用技巧,帮助您将 AI 的力量融入到命令行工作流中。

什么是 Google Gemini CLI?

Google Gemini CLI 是一个基于 Google Gemini 大模型构建的开源命令行界面工具,它将 Gemini 强大的 AI 能力带到您的终端。

GitHub 项目地址: https://github.com/google-gemini/gemini-cli

Gemini CLI 的核心价值在于其能够理解代码、执行复杂查询、自动化重复性任务,并利用 Gemini 的多模态能力(如图像识别)生成创意内容。

核心功能亮点

  • 大型代码库支持: 能够处理超过100万个上下文令牌(context tokens),这意味着它可以轻松分析和理解大型项目和复杂的代码库。
  • 多模态应用原型: 具备快速从非结构化数据(如 PDF 文档、草图或图片)中提取信息并生成应用原型的能力,加速产品设计与迭代。
  • 自动化 DevOps 任务: 能够执行常见的 DevOps 操作,例如自动化 Git 操作、获取 Pull Request (PR) 信息、创建迁移计划等,显著提高运维效率。
  • 工具集成: 通过 MCP 服务器,可以连接并利用 Google 的其他媒体生成模型,如 Imagen(图像生成)、Veo(视频生成)和 Lyria(音乐生成),拓展其应用范围。
  • 内置网页搜索: 确保 AI 响应的及时性和准确性,提供最新的信息支持。

Google Gemini CLI 安装指南

本指南以 macOS 系统为例,但在 Windows 或 Linux 上步骤类似,所有操作均在终端或命令行中完成。

先决条件

在安装 Gemini CLI 之前,请确保您的系统已安装 Node.js 18 或更高版本。您可以通过运行以下命令来检查当前 Node.js 版本:

node -v

如果版本不符合要求,请先升级 Node.js

安装方式

有两种主要方式可以安装和运行 Gemini CLI:

选项 1: 直接运行 (无需全局安装)

此方法适用于希望快速尝试或避免全局安装的用户。每次使用时,您需要直接通过 npx 执行:

npx https://github.com/google-gemini/gemini-cli

这种方式会在运行时从 GitHub 下载并执行 CLI,不会在您的系统上留下持久的安装文件。

选项 2: 全局安装 (推荐)

对于频繁使用的用户,推荐进行全局安装。这使得您可以在任何目录下直接通过 gemini 命令启动 CLI。在您的终端中运行以下命令:

sudo npm install -g @google/gemini-cli

请注意,如果使用 sudo,系统可能会提示您输入管理员密码。

安装完成后,只需在终端中输入 gemini 即可启动交互式 CLI。首次运行时,它可能会请求一些必要的权限,请按照提示确认以继续。

首次配置 Gemini CLI

首次启动 Gemini CLI 后,它将引导您完成一系列简短的设置步骤。

步骤 1: 选择主题

CLI 会提供多个主题样式供您选择。根据您的喜好,选择一个主题后按 Enter 键确认。

2. 步骤 2: 选择登录方式

选择您希望用于访问 Gemini API 的登录方式。推荐使用 “Login with Google” 选项,它通常提供免费额度,支持 每分钟60次请求每天1000次请求,足以满足大多数个人开发需求。选择后按 Enter

如果您需要更高的请求限制、企业级访问或偏好使用 API 密钥,可以执行以下操作:

  1. 首先,从 Google AI Studio 获取您的专属 API 密钥

  2. 然后,将其设置为环境变量。这通常在您的 .bashrc.zshrc.profile 文件中完成:

    export GEMINI_API_KEY="YOUR_API_KEY"
    

注意: 使用 API 密钥 通常用于直接的 API 调用场景,而本指南主要关注 CLI 的交互式体验。

3. 步骤 3: 浏览器认证

在您选择“Login with Google”后,系统会自动打开一个浏览器窗口。请使用您的 Google 账号完成登录和授权。

登录成功后,您将在浏览器中看到确认信息,表示 Gemini CLI 已成功认证。此时,您可以回到终端,开始使用 Gemini CLI

开始使用 Gemini CLI

现在,一切准备就绪!您可以在 CLI 中直接输入提示词,与 Gemini 进行交互。

例如,您可以直接输入一个问题或指令:

> Explain what is a LLM?

Gemini CLI 提示示例: Gemini CLI 提示示例

上传和引用本地文件

Gemini CLI 支持处理本地文件。要在 CLI 中上传并引用文件,请使用 @ 符号触发文件选择界面:

> Analyze this document: @

输入 @ 后,CLI 将引导您选择本地文件,并将其内容发送给 Gemini 进行分析或处理。

Gemini CLI 文件上传示例: Gemini CLI 文件上传示例

在 VSCode 中使用 Gemini CLI

您也可以直接在 VS Code 的集成终端中运行 gemini 命令。启动后,使用 @ 命令选择文件并开始对话,与在独立终端中的体验一致。

例如,您可以在 VS Code 终端中输入:

> Help me write a simple calculator in Python

CLI 可能会在过程中请求“写入权限”,这通常是为了允许 Gemini 生成的代码或其他内容写入到文件系统,请确认。

使用技巧与注意事项

  • 模型回退: 如果网络连接不稳定或 Gemini CLI 遇到暂时性问题,它可能会自动从更强大的 gemini-2.5-pro 模型回退到速度更快的 gemini-2.5-flash 模型,以确保服务的持续性。
  • 查看可用命令: 要查找 Gemini CLI 中可用的命令和使用提示,只需在 CLI 交互界面中输入 / 即可。这将显示一个帮助菜单,指导您探索更多功能。

Gemini CLI 是开发者、DevOps 工程师和数据分析师的强大 AI 助手,它通过自然语言指令简化代码分析、自动化工作流程并支持创意生成,是提升工作效率的利器。

关于

关注我获取更多资讯

公众号
📢 公众号
个人号
💬 个人号
使用 Hugo 构建
主题 StackJimmy 设计