免费网站生成,学平面设计怎么样啊,易语言做网站登陆,香奈儿网站建设目标使用了5个subset,也是用了text-image和text-video进行训练的
也是进行了复杂的视频选择。同movie gen.
也进行了模型切断#xff0c;用拉普拉斯算子找到最清晰的一帧作为训练的起始
训练了不同的模型去选择数据#xff0c;比如用Dover去选择美观度比较好的数据#xff0c…使用了5个subset,也是用了text-image和text-video进行训练的
也是进行了复杂的视频选择。同movie gen.
也进行了模型切断用拉普拉斯算子找到最清晰的一帧作为训练的起始
训练了不同的模型去选择数据比如用Dover去选择美观度比较好的数据用其他模型去选择清晰度高的模型等。判断motion大小比如静止的把不合适的视频去掉。用OCR模型把带有很多字的视频拿掉。用YOLOX把一些敏感信息拿掉。虽然拿掉了很多数据但是数据多样性高也好所以用个小模型去测试那个去掉视频的操作好。图4
最后的finetune数据又是人工标注大概一百万。用的JSON保存信息
加强版的dense description
background\style等关键词还用了dropout设置多样性更多的captions使得描述格式不会太固定。
数据对于machine learning很重要