前言
GPT-4V是一种创新的AI模型,不仅可以理解文本还可以理解图像。
在这里,为了使初学者更容易理解,我们将介绍如何使用GPT-4V进行图像分析的方法。
所需材料
OpenAI的API密钥:要使用GPT-4,需要OpenAI的API密钥。
Python:此代码是用Python编写的。
代码说明
以下是使用GPT-4V回答与图像相关问题的Python代码。
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-4-vision-preview",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "这张图片里有什么?"},
{
"type": "image_url",
"image_url": {
"url": "图片的URL",
},
},
],
}
],
max_tokens=300,
)
print(response.choices[0])
处理细节
导入库:使用from openai import OpenAI
导入OpenAI库。
配置客户端:使用client = OpenAI()
配置OpenAI客户端。
创建请求:使用chat.completions.create
方法创建包含问题和图像URL的请求。
指定图像URL:在"url": "图片的URL"
部分指定要分析的图像的URL。
输出响应:使用print(response.choices[0])
输出来自模型的响应