Search: github.com/policy-gradient | Heykuki News

Heykuki News

Top New Best Ask Show Jobs

Top New Best Ask Show Jobs

1.

Implementing DeepSeek R1's GRPO algorithm from scratch (github.com/policy-gradient)

192 points

a year ago

2.

A minimal hackable implementation of policy gradients (GRPO, PPO, REINFORCE) (github.com/zafstojano)

1 point

5 months ago

3.

Experimenting with policy gradient methods in Jax (github.com/elliotvilhelm)

2 points

a year ago

4.

OpenAi Gym: Policy Gradient (github.com/Mortiniera)

2 points

7 years ago

5.

Multi-Agent Deep Deterministic Policy Gradient (github.com/openai)

2 points

8 years ago

6.

Controlling a unicycle with Policy Gradients (github.com/pauli-space)

1 point

8 years ago

7.

3 points

9 months ago

8.

Show HN: Qantify – GPU-Accelerated Trading Library with Advanced Math and AutoML (github.com/Alradyin)

1 point

7 months ago