ptx

Here are 54 public repositories matching this topic...

ashvardanian / less_slow.cpp

Playing around "Less Slow" coding practices in C++ 20, C, CUDA, PTX, & Assembly, from numerics & SIMD to coroutines, ranges, exception handling, networking and user-space IO

Updated Dec 23, 2025
C++

m4rs-mt / ILGPU

Star

ILGPU JIT Compiler for high-performance .Net GPU programs

cpu compiler dotnet amd gpu opencl parallel cuda intel jit nvidia gpgpu msil cil kernels ptx gpgpu-computing ilgpu

Updated Mar 19, 2026
C#

tpoisonooo / how-to-optimize-gemm

Star

row-major matmul optimization

vulkan cuda armv7 arm64 ptx gemm-optimization cuda-kernel int4

Updated Feb 24, 2026
C++

coderonion / awesome-cuda-and-hpc

Star

🚀🚀🚀 This repository lists some awesome public CUDA, cuda-python, cuBLAS, cuDNN, CUTLASS, TensorRT, TensorRT-LLM, Triton, TVM, MLIR, PTX and High Performance Computing (HPC) projects.

Updated Aug 2, 2025

SunsetQuest / CudaPAD

Star

CudaPAD is a PTX/SASS viewer for NVIDIA Cuda kernels and provides an on-the-fly view of the assembly.

windows gpu cuda nvidia ptx cuda-programming ptx-utils

Updated Jan 17, 2023
C#

zamaudio / ptformat

Star

Free software file format parser for Avid ProTools sessions

session interoperability ardour ptx ptf protools

Updated Dec 15, 2025
C++

deciding / txl

Sponsor

Star

TeraXLang - Triton Extension for LLM. As fast as FlashAttention FlashMLA, etc.

compiler dsl triton ptx mlir

Updated Mar 20, 2026
C++

Energinet-SimTools / MTB

Star

Energinets Model Testbench. Automate gridcompliance studies in PSCAD and Powerfactory.

generator power-electronics solar-energy renewable-energy wind-energy dcc powergrid ptx powerfactory powersystems high-voltage rfg hvdc pscad powersystem-simulation gridcompliance green-transition power2x

Updated Mar 18, 2026
Python

ProjectPhysX / PTXprofiler

Sponsor

Star

A simple profiler to count Nvidia PTX assembly instructions of OpenCL/SYCL/CUDA kernels for roofline model analysis.

hpc profiler gpu opencl cuda nvidia gpu-acceleration gpu-computing sycl nvidia-cuda nvidia-gpu ptx gpu-programming roofline-model ptx-utils

Updated Mar 20, 2025
C++

seekbytes / ptxNinja

Star

Binary Ninja plugin for reverse engineering PTX -- the virtual instruction set architecture of CUDA-based GPUs.

cuda decompilation binaryninja ptx seekbytes-ptxninja-41d6b9de

Updated Mar 6, 2026
Rust

bikrammajhi / 100-days-of-GPU

Star

This is my 🔥 100 Days of GPU — a wild, hands-on journey through CUDA/CUTLASS kernels, Triton spells, and PTX sorcery.

mojo cuda triton cutlass ptx nsight-compute thunderkittens

Updated Mar 18, 2026
HTML

danielcamposramos / Knowledge3D

Star

Web knowledge is fragmented — duplicated across fonts, embeddings, metadata, and renderings. Humans see pixels, AI sees tokens, neither shares the source. Knowledge3D: a sovereign GPU-native reference implementation for W3C PM-KR, where humans and AI consume the same procedural knowledge from one source.