Search: github.com/kvcache-ai | Heykuki News

Heykuki News

Top New Best Ask Show Jobs

Top New Best Ask Show Jobs

1.

Show HN: KTransformers–236B Model and 1M Context LLM Inference on Local Machines (github.com/kvcache-ai)

20 points

2 years ago

2.

Show HN: KTransformers:671B DeepSeek-R1 on a Single Machine-286 tokens/s Prefill (github.com/kvcache-ai)

14 points

a year ago

3.

Mooncake: A KVCache-Centric Disaggregated Architecture for LLM Serving (github.com/kvcache-ai)

13 points

2 years ago

4.

Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving (github.com/kvcache-ai)

8 points

a year ago