最新 最热

【YOLOv5】【模型压缩与加速】【量化】FP32、FP16、INT8

量化是将模型参数的存储类型从高精度存储降到低精度存储,从而达到减小模型体积大小、加快模型推理速度的效果。

2023-11-13
0

【yolov5】onnx的INT8量化engine

然后在yolov5_tensorrt_int8_tools的convert_trt_quant.py 修改如下参数

2023-11-13
0

多少因子才管够?

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,曾荣获AMMA优秀品牌力、优...

2023-11-08
0

Yolo系列模型的部署、精度对齐与int8量化加速

Github开源地址:https://github.com/thb1314/mmyolo_tensorrt/

2023-11-08
1

YOLO系列模型的部署、精度对齐与int8量化加速

大家好,我是海滨。写这篇文章的目的是为宣传我在23年初到现在完成的一项工作---Yolo系列模型在TensorRT上的部署与量化加速,目前以通过视频的形式在B站发布(不收费,只图一个一剑三连)。...

2023-11-07
1

向量化引擎怎么提升数据库性能

数据库向量化是一项工程性很大的挑战,但可为StarRocks等实时分析引擎提供数量级性能提升。

2023-11-06
0

openGauss-向量化执行引擎-索引扫描CStoreIndexScan

openGauss实现了向量化执行引擎,达到算子级别的并行。也就是说在执行器火山模型基础上,一次处理一批数据,而不是一次一个元组。这样可以充分利用SIMD指令进行优化,达到指令级别并行。本文关注索引扫描算子CStoreIndexScan...

2023-11-05
0

openGauss-向量化执行引擎-VecUnique算子

openGauss实现了向量化执行引擎,达到算子级别的并行。也就是说在执行器火山模型基础上,一次处理一批数据,而不是一次一个元组。这样可以充分利用SIMD指令进行优化,达到指令级别并行。前期我们介绍了PgSQL Unique算子的实...

2023-11-05
1

8张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍

随着GPT-4的架构被知名业内大佬「开源」,混合专家架构(MoE)再次成为了研究的重点。

2023-11-02
0

Winton CIO:关于CTA策略的深入的探讨

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,曾荣获AMMA优秀品牌力、优...

2023-11-02
0