最大CLIP!LAION发布CLIP的扩增定律 全球今日讯


(资料图片仅供参考)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

关键词:

为您推荐

最大CLIP!LAION发布CLIP的扩增定律 全球今日讯

点蓝色字关注“机器学习算法工程师”设为星标,干货直达!近日,LAION等机构在Reproduciblescalinglawsforcontrastive

来源:2022-12-27

四川子柒文化发生工商变更 微念称与李子柒达成和解

四川子柒文化发生工商变更微念称与李子柒达成和解2022年12月27日13:45中国新闻网

来源:2022-12-27

微资讯!【和讯原油早报】上海中期期货:需求忧虑抑制油价

隔夜原油主力合约期价震荡上行。沙特重申OPEC+减产立场不动摇,俄罗斯也可能出台针对西方价格上限的反制举措。此外,Keystone输油管道恢复时间

来源:2022-12-27

热文:人民网: 人民网股份有限公司关于使用部分闲置募集资金进行现金管理到期赎回的公告

人民网:人民网股份有限公司关于使用部分闲置募集资金进行现金管理到期赎回的公告

来源:2022-12-26

中国是全球粮食安全的积极贡献者(专家解读)

在山东省邹平市西董街道一种植基地拍摄的谷子(九月二日摄)。董乃德摄(新华社发)韩国《亚细亚经济》近日刊文称,中国粮食产量创历史新高,

来源:2022-12-26

有人为了“名媛”人设疯狂盗窃,有人坦然面对平凡人生 当前观察

通过假象换来的流量就像泡沫,一碰就碎。不久前,一位上海姑娘报警称房东编程偷走她高达6位数的财物,而这位房东不仅在上海有多处房产,并且还

来源:2022-12-26

丽攀高速月底全线通车:成都自驾到丽江全高速,全程约10小时

盼了多年,丽攀高速即将全线通车!12月30日,华坪至丽江高速公路(华坪段)将并网通车收费,这意味着“攀枝花—-华坪—-永胜—-大理、丽江”实

来源:2022-12-25

【报资讯】第十八届长沙国际车展开幕

24日,第十八届中国(长沙)国际汽车博览会(以下简称“长沙国际车展”)在长沙国际会展中心开幕。今年长沙国际车展以“‘汽’势磅礴向未来”为全

来源:2022-12-24