Channel - Tony Shin

VeRA: Vector-based Random Matrix Adaptation

Tony Shin
246 views • 7 months ago

PaLI-3 Vision Language Models: Smaller, Faster, Stronger

Tony Shin
421 views • 7 months ago

HyperAttention: Long-context Attention in Near-Linear Time

Tony Shin
364 views • 7 months ago

Fast Feedforward Networks

Tony Shin
411 views • 7 months ago

Nougat: Neural Optical Understanding for Academic Documents

Tony Shin
222 views • 7 months ago

Retentive Network: A Successor to Transformer for Large Language Models

Tony Shin
790 views • 7 months ago

LLava: Visual Instruction Tuning

Tony Shin
872 views • 7 months ago

BloombergGPT: A Large Language Model for Finance

Tony Shin
417 views • 1 year ago

ImageBind: One Embedding Space To Bind Them All

Tony Shin
852 views • 1 year ago

Segment Anything

Tony Shin
461 views • 1 year ago

Are Emergent Abilities of Large Language Models a Mirage?

Tony Shin
2.6K views • 1 year ago

Synthetic Data Boosts ImageNet Classification

Tony Shin
211 views • 1 year ago

Unlimiformer: Long-Range Transformers with Unlimited Length Input

Tony Shin
710 views • 1 year ago

[Tutorial] Image Super Resolution without Photoshop

Tony Shin
1.1K views • 2 years ago

YOLO9000: Better, Faster, Stronger

Tony Shin
1.1K views • 2 years ago

NÜWA: Visual Synthesis Pre-training for Neural visUal World creAtion

Tony Shin
1K views • 2 years ago

Florence: A New Foundation Model for Computer Vision

Tony Shin
1.2K views • 2 years ago

DSSD: Deconvolutional Single Shot Detector

Tony Shin
572 views • 2 years ago

MAE: Masked Autoencoders Are Scalable Vision Learners

Tony Shin
4.7K views • 2 years ago

PVANet: Deep but Lightweight Neural Networks forReal-time Object Detection

Tony Shin
371 views • 2 years ago

SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers

Tony Shin
4.1K views • 2 years ago

R-FCN: Object Detection via Region-based Fully Convolutional Networks

Tony Shin
1K views • 2 years ago

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Tony Shin
2.1K views • 2 years ago

Pix2Seq: A Language Modeling Framework for Object Detection

Tony Shin
1.6K views • 2 years ago

Improved Regularization of Convolutional Neural Networks with Cutout

Tony Shin
386 views • 2 years ago

VICReg: Variance-Invariance-Covariance Regularization for Self-Supervised Learning

Tony Shin
2.5K views • 3 years ago

SSD: Single Shot MultiBox Detector

Tony Shin
5.5K views • 3 years ago

Barlow Twins: Self-Supervised Learning via Redundancy Reduction

Tony Shin
2K views • 3 years ago

MLP-Mixer: An all-MLP Architecture for Vision

Tony Shin
1.6K views • 3 years ago

YOLO: Unified, Real-Time Object Detection

Tony Shin
841 views • 3 years ago

Load More