ReLU vs. GeLU

There's definitely a pretty significant difference between the two (in the case of my example in main.py).

GeLU seems to be relatively more accurate than ReLU, but it's not always the case. It's always good to test out different activation functions to see which one works best for your specific use case.

Example Output

An example output from running main.py

Test Loss (GeLU): 0.13099078834056854
Test Loss (ReLU): 0.31609782576560974
Actual: 30.0 | GeLU: 30.32281494140625 | ReLU: 30.15665626525879
Actual: 22.0 | GeLU: 21.602794647216797 | ReLU: 21.220478057861328

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.gitignore		.gitignore
README.md		README.md
_types.py		_types.py
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ReLU vs. GeLU

Example Output

About

Releases

Packages

Languages

Simpson-Computer-Technologies-Research/relu_vs_gelu

Folders and files

Latest commit

History

Repository files navigation

ReLU vs. GeLU

Example Output

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages