-
Notifications
You must be signed in to change notification settings - Fork 88
Open
Description
目前从示例以及记忆的组织方式看貌似只支持文本 (text) 的记忆?如果是配合多模态模型使用,尤其是在短期记忆的 message 列表中可能包含图片或者文件的 url。比如:
{
"role": "user",
"content": [
{
"image_url": {
"url": "https://img2.baidu.com/it/u=2976763563,2523722948&fm=253&app=138&f=JPEG?w=800&h=1200"
},
"type": "image_url"
},
{
"text": "这只狗什么品种",
"type": "text"
}
]}
如果当用户问了几句后又继续讨论和这张图片相关的其他细节内容,请问这块有考虑过吗?是通过工程化的方法将 url 拼到 text 中,还是为多模态提供单独的支持更好呢?
Metadata
Metadata
Assignees
Labels
No labels