4 8

Kamen Petroff

siddhadev

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 months ago

Moshi: a speech-text foundation model for real-time dialogue

updated a collection over 1 year ago

to-read

updated a collection over 1 year ago

to-read

View all activity

Organizations

None yet

upvoted a paper 3 months ago

Moshi: a speech-text foundation model for real-time dialogue

Paper • 2410.00037 • Published Sep 17, 2024 • 6

updated a collection over 1 year ago

to-read

Collection

1 item • Updated Jan 25, 2024

upvoted 2 papers about 2 years ago

Reinforced Self-Training (ReST) for Language Modeling

Paper • 2308.08998 • Published Aug 17, 2023 • 3

Efficiently Modeling Long Sequences with Structured State Spaces

Paper • 2111.00396 • Published Oct 31, 2021 • 3

commented a paper about 2 years ago

Bayesian Flow Networks

Paper • 2308.07037 • Published Aug 14, 2023 • 3 •

upvoted a paper about 2 years ago

Bayesian Flow Networks

Paper • 2308.07037 • Published Aug 14, 2023 • 3

commented a paper about 2 years ago

Hyena Hierarchy: Towards Larger Convolutional Language Models

Paper • 2302.10866 • Published Feb 21, 2023 • 7 •

upvoted a paper about 2 years ago

Hyena Hierarchy: Towards Larger Convolutional Language Models

Paper • 2302.10866 • Published Feb 21, 2023 • 7

commented a paper about 2 years ago

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 172 •

commented 2 papers over 2 years ago

Hyena Hierarchy: Towards Larger Convolutional Language Models

Paper • 2302.10866 • Published Feb 21, 2023 • 7 •

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 172 •

upvoted 2 papers over 2 years ago

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 172

Improving language models by retrieving from trillions of tokens

Paper • 2112.04426 • Published Dec 8, 2021 • 1

commented a paper over 2 years ago

Unlimiformer: Long-Range Transformers with Unlimited Length Input

Paper • 2305.01625 • Published May 2, 2023 • 6 •

upvoted a paper over 2 years ago

Unlimiformer: Long-Range Transformers with Unlimited Length Input

Paper • 2305.01625 • Published May 2, 2023 • 6

commented a paper over 2 years ago

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 172 •

Kamen Petroff

AI & ML interests

Recent Activity

Organizations

siddhadev's activity