最新 最热

TensorRT LLM--Beam Search

Beam Search思想介绍:如何通俗的理解beam search? - 知乎 (zhihu.com)

2023-11-21
0

TensorRT LLM--Paged KV Cache

技术出处:vLLM: Easy, Fast, and Cheap LLM Serving with PagedAttention | vLLM Blog

2023-11-21
0

TensorRT LLM vs OpenPPL LLM

PPL LLM只支持baichuan、chatglm、llama三个模型,Tensor-LLM支持几乎所有大模型。

2023-11-21
0