最新 最热

【人工智能】Transformers之Pipeline(概述):30w+大模型极简应用

pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为语音(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks)。共计覆盖32万个...

2024-08-13
1

【人工智能】Transformers之Pipeline(九):物体检测(object-detection)

pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks)。共计覆盖32万个...

2024-08-13
1

【人工智能】Transformers之Pipeline(八):文生图/图生图(text-to-image/image-to-image)

pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks)。共计覆盖32万个...

2024-08-13
1

【人工智能】Transformers之Pipeline(七):图像分割(image-segmentation)

pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks)。共计覆盖32万个...

2024-08-13
1

【人工智能】Transformers之Pipeline(六):图像分类(image-classification)

pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks)。共计覆盖32万个...

2024-08-13
1

【人工智能】Transformers之Pipeline(五):深度估计(depth-estimation)

pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks)。共计覆盖32万个...

2024-08-13
1

【人工智能】Transformers之Pipeline(二):自动语音识别(automatic-speech-recognition)

pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks),共计覆盖32万个模...

2024-08-13
1

什么是心理安全,以及为什么科技现在需要它?

科技曾经推崇心理安全;现在,情况并非如此。什么是心理安全,为什么工程团队比以往任何时候都更需要内部说真话?

2024-08-13
1

西电 & 上交大提出 S2Mamba, 超越传统 Transformer, 提升高光谱图像分类准确性 !

高光谱图像(HSI)由众多光谱带组成,由于其丰富的物质信息,能够进行土地覆盖分析,在精准农业、矿物勘探和环境监测等领域具有广泛的应用。因此,设计一个更有效、更高效的高光谱图像分类模型具有很强的激励性。作为广泛使用的...

2024-08-12
1

AlexNet 与 EfficientNetB0 在图像标注中的压缩与效率分析 !

近年来,计算机视觉与自然语言处理的融合开辟了一个有趣的研究领域——图像字幕生成。这个领域不仅仅是关于智能思考;它像是深入探究机器如何能像人类一样看和说话。基本上,图像字幕生成是关于计算机自行用文字描述图片。...

2024-08-12
1