medmekk HF Staff commited on May 5

Commit

1e759d6

verified ·

1 Parent(s): 3508bab

Upload custom kernels

Browse files

Files changed (23) hide show

build/torch-universal/liger_kernels/_ops.py +2 -2
build/torch-universal/liger_kernels/cross_entropy.py +4 -4
build/torch-universal/liger_kernels/dyt.py +4 -4
build/torch-universal/liger_kernels/fused_linear_cross_entropy.py +5 -5
build/torch-universal/liger_kernels/geglu.py +3 -3
build/torch-universal/liger_kernels/group_norm.py +2 -2
build/torch-universal/liger_kernels/jsd.py +2 -2
build/torch-universal/liger_kernels/kl_div.py +3 -3
build/torch-universal/liger_kernels/layer_norm.py +3 -3
build/torch-universal/liger_kernels/rms_norm.py +4 -4
build/torch-universal/liger_kernels/swiglu.py +2 -2
build/torch-universal/liger_kernels/tvd.py +1 -1
torch-ext/liger_kernels/cross_entropy.py +4 -4
torch-ext/liger_kernels/dyt.py +4 -4
torch-ext/liger_kernels/fused_linear_cross_entropy.py +5 -5
torch-ext/liger_kernels/geglu.py +3 -3
torch-ext/liger_kernels/group_norm.py +2 -2
torch-ext/liger_kernels/jsd.py +2 -2
torch-ext/liger_kernels/kl_div.py +3 -3
torch-ext/liger_kernels/layer_norm.py +3 -3
torch-ext/liger_kernels/rms_norm.py +4 -4
torch-ext/liger_kernels/swiglu.py +2 -2
torch-ext/liger_kernels/tvd.py +1 -1

build/torch-universal/liger_kernels/_ops.py CHANGED Viewed

@@ -1,8 +1,8 @@
 import torch
-ops = torch.ops._liger_kernels_20250505100655
 def add_op_namespace_prefix(op_name: str):
     """
     Prefix op by namespace.
     """
-    return f"_liger_kernels_20250505100655::{op_name}"

 import torch
+ops = torch.ops._liger_kernels_20250505101012
 def add_op_namespace_prefix(op_name: str):
     """
     Prefix op by namespace.
     """
+    return f"_liger_kernels_20250505101012::{op_name}"

build/torch-universal/liger_kernels/cross_entropy.py CHANGED Viewed

@@ -6,10 +6,10 @@ import torch
 import triton
 import triton.language as tl
-from utils import compare_version
-from utils import element_mul_kernel
-from utils import is_hip
-from utils import infer_device
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import compare_version
+from .utils import element_mul_kernel
+from .utils import is_hip
+from .utils import infer_device
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

build/torch-universal/liger_kernels/dyt.py CHANGED Viewed

@@ -4,10 +4,10 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import compare_version
-from utils import ensure_contiguous
-from utils import infer_device
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import compare_version
+from .utils import ensure_contiguous
+from .utils import infer_device
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

build/torch-universal/liger_kernels/fused_linear_cross_entropy.py CHANGED Viewed

@@ -1,11 +1,11 @@
 import torch
 import triton
-from cross_entropy import liger_cross_entropy_kernel
-from utils import amp_custom_bwd
-from utils import amp_custom_fwd
-from utils import element_mul_kernel
-from utils import is_hip
 # The hard limit of TRITON_MAX_TENSOR_NUMEL is 1048576 https://github.com/triton-lang/triton/blob/ba42a5c68fd0505f8c42f4202d53be0f8d9a5fe0/python/triton/language/core.py#L19
 # However, setting limit as 65536 as in LayerNorm tutorial is faster because of less register spilling

 import torch
 import triton
+from .cross_entropy import liger_cross_entropy_kernel
+from .utils import amp_custom_bwd
+from .utils import amp_custom_fwd
+from .utils import element_mul_kernel
+from .utils import is_hip
 # The hard limit of TRITON_MAX_TENSOR_NUMEL is 1048576 https://github.com/triton-lang/triton/blob/ba42a5c68fd0505f8c42f4202d53be0f8d9a5fe0/python/triton/language/core.py#L19
 # However, setting limit as 65536 as in LayerNorm tutorial is faster because of less register spilling

build/torch-universal/liger_kernels/geglu.py CHANGED Viewed

@@ -4,9 +4,9 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import compare_version
-from utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import compare_version
+from .utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

build/torch-universal/liger_kernels/group_norm.py CHANGED Viewed

@@ -4,8 +4,8 @@ import torch
 import triton
 import triton.language as tl
-from utils import compare_version
-from utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import compare_version
+from .utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

build/torch-universal/liger_kernels/jsd.py CHANGED Viewed

@@ -4,8 +4,8 @@ import torch
 import triton
 import triton.language as tl
-from utils import ensure_contiguous
-from utils import infer_device
 @triton.jit

 import triton
 import triton.language as tl
+from .utils import ensure_contiguous
+from .utils import infer_device
 @triton.jit

build/torch-universal/liger_kernels/kl_div.py CHANGED Viewed

@@ -4,9 +4,9 @@ import torch
 import triton
 import triton.language as tl
-from utils import ensure_contiguous
-from utils import is_hip
-from utils import infer_device
 def get_num_warps(BLOCK_SIZE):

 import triton
 import triton.language as tl
+from .utils import ensure_contiguous
+from .utils import is_hip
+from .utils import infer_device
 def get_num_warps(BLOCK_SIZE):

build/torch-universal/liger_kernels/layer_norm.py CHANGED Viewed

@@ -5,9 +5,9 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import compare_version
-from utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import compare_version
+from .utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

build/torch-universal/liger_kernels/rms_norm.py CHANGED Viewed

@@ -17,10 +17,10 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import compare_version
-from utils import ensure_contiguous
-from utils import torch_to_triton_dtype
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import compare_version
+from .utils import ensure_contiguous
+from .utils import torch_to_triton_dtype
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

build/torch-universal/liger_kernels/swiglu.py CHANGED Viewed

@@ -2,8 +2,8 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import ensure_contiguous
 @triton.jit

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import ensure_contiguous
 @triton.jit

build/torch-universal/liger_kernels/tvd.py CHANGED Viewed

@@ -5,7 +5,7 @@ import torch
 import triton
 import triton.language as tl
-from utils import ensure_contiguous
 MAX_FUSED_SIZE = 65536 // 4

 import triton
 import triton.language as tl
+from .utils import ensure_contiguous
 MAX_FUSED_SIZE = 65536 // 4

torch-ext/liger_kernels/cross_entropy.py CHANGED Viewed

@@ -6,10 +6,10 @@ import torch
 import triton
 import triton.language as tl
-from utils import compare_version
-from utils import element_mul_kernel
-from utils import is_hip
-from utils import infer_device
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import compare_version
+from .utils import element_mul_kernel
+from .utils import is_hip
+from .utils import infer_device
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

torch-ext/liger_kernels/dyt.py CHANGED Viewed

@@ -4,10 +4,10 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import compare_version
-from utils import ensure_contiguous
-from utils import infer_device
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import compare_version
+from .utils import ensure_contiguous
+from .utils import infer_device
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

torch-ext/liger_kernels/fused_linear_cross_entropy.py CHANGED Viewed

@@ -1,11 +1,11 @@
 import torch
 import triton
-from cross_entropy import liger_cross_entropy_kernel
-from utils import amp_custom_bwd
-from utils import amp_custom_fwd
-from utils import element_mul_kernel
-from utils import is_hip
 # The hard limit of TRITON_MAX_TENSOR_NUMEL is 1048576 https://github.com/triton-lang/triton/blob/ba42a5c68fd0505f8c42f4202d53be0f8d9a5fe0/python/triton/language/core.py#L19
 # However, setting limit as 65536 as in LayerNorm tutorial is faster because of less register spilling

 import torch
 import triton
+from .cross_entropy import liger_cross_entropy_kernel
+from .utils import amp_custom_bwd
+from .utils import amp_custom_fwd
+from .utils import element_mul_kernel
+from .utils import is_hip
 # The hard limit of TRITON_MAX_TENSOR_NUMEL is 1048576 https://github.com/triton-lang/triton/blob/ba42a5c68fd0505f8c42f4202d53be0f8d9a5fe0/python/triton/language/core.py#L19
 # However, setting limit as 65536 as in LayerNorm tutorial is faster because of less register spilling

torch-ext/liger_kernels/geglu.py CHANGED Viewed

@@ -4,9 +4,9 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import compare_version
-from utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import compare_version
+from .utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

torch-ext/liger_kernels/group_norm.py CHANGED Viewed

@@ -4,8 +4,8 @@ import torch
 import triton
 import triton.language as tl
-from utils import compare_version
-from utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import compare_version
+from .utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

torch-ext/liger_kernels/jsd.py CHANGED Viewed

@@ -4,8 +4,8 @@ import torch
 import triton
 import triton.language as tl
-from utils import ensure_contiguous
-from utils import infer_device
 @triton.jit

 import triton
 import triton.language as tl
+from .utils import ensure_contiguous
+from .utils import infer_device
 @triton.jit

torch-ext/liger_kernels/kl_div.py CHANGED Viewed

@@ -4,9 +4,9 @@ import torch
 import triton
 import triton.language as tl
-from utils import ensure_contiguous
-from utils import is_hip
-from utils import infer_device
 def get_num_warps(BLOCK_SIZE):

 import triton
 import triton.language as tl
+from .utils import ensure_contiguous
+from .utils import is_hip
+from .utils import infer_device
 def get_num_warps(BLOCK_SIZE):

torch-ext/liger_kernels/layer_norm.py CHANGED Viewed

@@ -5,9 +5,9 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import compare_version
-from utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import compare_version
+from .utils import ensure_contiguous
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

torch-ext/liger_kernels/rms_norm.py CHANGED Viewed

@@ -17,10 +17,10 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import compare_version
-from utils import ensure_contiguous
-from utils import torch_to_triton_dtype
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import compare_version
+from .utils import ensure_contiguous
+from .utils import torch_to_triton_dtype
 if compare_version("triton", operator.ge, "3.0.0"):
     try:

torch-ext/liger_kernels/swiglu.py CHANGED Viewed

@@ -2,8 +2,8 @@ import torch
 import triton
 import triton.language as tl
-from utils import calculate_settings
-from utils import ensure_contiguous
 @triton.jit

 import triton
 import triton.language as tl
+from .utils import calculate_settings
+from .utils import ensure_contiguous
 @triton.jit

torch-ext/liger_kernels/tvd.py CHANGED Viewed

@@ -5,7 +5,7 @@ import torch
 import triton
 import triton.language as tl
-from utils import ensure_contiguous
 MAX_FUSED_SIZE = 65536 // 4

 import triton
 import triton.language as tl
+from .utils import ensure_contiguous
 MAX_FUSED_SIZE = 65536 // 4