hi, paul here

From scratch implementation of some iconic RL techniques for solving Atari Games

RL-based post-training method for increasing reasoning capabilities in LLMs

Ideological Bias Auditing in LLMs

Multi-Answer Speculative Decoding for effficent LLM Inference

Monte Carlo Tree Search for Solving Sokoban

Basic C++ Autograd Engine written in C++

Compiling a json-like file to a torch.nn.Module