`olm.nn.feedforward.geglu_ffn`

Classes

Bases: olm.nn.feedforward.base.FeedForwardBase

Feed-Forward Network using GeGLU activation.

Implements: x = DownProj(GeGLU(UpProj(x))). UpProj expands to 2 * hidden_dim to support splitting for the gate.

Parameters

embed_dim (int): Input dimension.
hidden_dim (int, optional): Hidden dimension. Defaults to 4 * embed_dim if None.
dropout (float, optional): Dropout probability. Defaults to 0.0.
bias (bool, optional): Whether to usage bias in linear layers. Defaults to True.
ff_multiplier (float, optional): Expansion factor if hidden_dim is None. Defaults to 4.0.

Apply GeGLU feed-forward projection.

Parameters

Returns