使用GPT-4V进行图像分析

前言

GPT-4V是一种创新的AI模型,不仅可以理解文本还可以理解图像。

在这里,为了使初学者更容易理解,我们将介绍如何使用GPT-4V进行图像分析的方法。

所需材料

OpenAI的API密钥:要使用GPT-4,需要OpenAI的API密钥。
Python:此代码是用Python编写的。

代码说明

以下是使用GPT-4V回答与图像相关问题的Python代码。

from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
    model="gpt-4-vision-preview",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "这张图片里有什么?"},
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "图片的URL",
                    },
                },
            ],
        }
    ],
    max_tokens=300,
)

print(response.choices[0])

处理细节

导入库:使用from openai import OpenAI导入OpenAI库。
配置客户端:使用client = OpenAI()配置OpenAI客户端。
创建请求:使用chat.completions.create方法创建包含问题和图像URL的请求。
指定图像URL:在"url": "图片的URL"部分指定要分析的图像的URL。
输出响应:使用print(response.choices[0])输出来自模型的响应