Flax Linen#
使用 JAX 的神经网络
Flax Linen 为使用 JAX 和神经网络的研究人员提供了端到端且灵活的用户体验。Flax 公开了 JAX 的全部功能。它由松散耦合的库组成,这些库通过端到端集成的 指南 和 示例 展示。
Flax Linen 被 数百个项目(并且还在增长)使用,包括开源社区(如 Hugging Face)和 Google(如 Gemini、Imagen、Scenic 和 Big Vision)。
特性#
安全性
Flax 的设计以正确性和安全性为目标。由于其不可变的模块和函数式 API,Flax 有助于减少在 JAX 中处理状态时出现的错误。
控制
Flax 通过其变量集合、RNG 集合和可变性条件,提供了比大多数神经网络框架更精细的控制和表达能力。
函数式 API
Flax 的函数式 API 通过 vmap、scan 等提升转换,从根本上重新定义了模块的功能,同时还实现了与其他 JAX 库(如 Optax 和 Chex)的无缝集成。
简洁的代码
Flax 的 compact
模块允许在其调用站点直接定义子模块,从而使代码更易于阅读并避免重复。
安装#
pip install flax
# or to install the latest version of Flax:
pip install --upgrade git+https://github.com/google/flax.git
Flax 安装 JAX 的原始 CPU 版本,如果您需要自定义版本,请查看 JAX 的安装页面。
基本用法#
class MLP(nn.Module): # create a Flax Module dataclass
out_dims: int
@nn.compact
def __call__(self, x):
x = x.reshape((x.shape[0], -1))
x = nn.Dense(128)(x) # create inline Flax Module submodules
x = nn.relu(x)
x = nn.Dense(self.out_dims)(x) # shape inference
return x
model = MLP(out_dims=10) # instantiate the MLP model
x = jnp.empty((4, 28, 28, 1)) # generate random data
variables = model.init(random.key(42), x)# initialize the weights
y = model.apply(variables, x) # make forward pass
了解更多#
快速入门
指南
示例
术语表
开发者注释
Flax 哲学
API 参考
生态系统#
Flax 中值得注意的示例包括
NLP 和计算机视觉模型
用于文本到图像生成的模型
用于文本生成的 5400 亿参数模型
文本到图像扩散模型
用于大规模计算机视觉的库
大规模计算机视觉模型
开源高性能 LLM
大型语言模型
设备上的可微分强化学习环境