RIS-Kernel: Running 64k context LLMs on CPU via sparse attention | Heykuki News

Heykuki News

Top New Best Ask Show Jobs

Top New Best Ask Show Jobs

RIS-Kernel: Running 64k context LLMs on CPU via sparse attention | Heykuki News

RIS-Kernel: Running 64k context LLMs on CPU via sparse attention

github.com/santosardr

2 points

5 days ago