Skip to content

请问是否可以支持包括多模态模型的记忆? #38

@Zpenya

Description

@Zpenya

目前从示例以及记忆的组织方式看貌似只支持文本 (text) 的记忆?如果是配合多模态模型使用,尤其是在短期记忆的 message 列表中可能包含图片或者文件的 url。比如:

{
    "role": "user",
    "content": [
        {
            "image_url": {
                "url": "https://img2.baidu.com/it/u=2976763563,2523722948&fm=253&app=138&f=JPEG?w=800&h=1200"
            },
            "type": "image_url"
        },
        {
            "text": "这只狗什么品种",
            "type": "text"
        }
    ]}

如果当用户问了几句后又继续讨论和这张图片相关的其他细节内容,请问这块有考虑过吗?是通过工程化的方法将 url 拼到 text 中,还是为多模态提供单独的支持更好呢?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions