Conozca lo último en aprendizaje automático, IA generativa y más en el Simposio WiML 2023.

Mezcla factorial

Ver en TensorFlow.org

Ejecutar en Google Colab

Ver fuente en GitHub

Descargar cuaderno

En este cuaderno se muestra cómo utilizar TensorFlow Probabilidad (PTF) a partir de una mezcla de muestra factorial de distribución gaussianas definido como:\(p(x_1, ..., x_n) = \prod_i p_i(x_i)\) donde: \(\begin{align*} p_i &\equiv \frac{1}{K}\sum_{k=1}^K \pi_{ik}\,\text{Normal}\left(\text{loc}=\mu_{ik},\, \text{scale}=\sigma_{ik}\right)\\1&=\sum_{k=1}^K\pi_{ik}, \forall i.\hphantom{MMMMMMMMMMM}\end{align*}\)

Cada variable \(x_i\) se modela como una mezcla de gaussianas, y la distribución conjunta sobre todos \(n\) variables es un producto de estas densidades.

Dado un conjunto de datos \(x^{(1)}, ..., x^{(T)}\), modelamos cada dataponit \(x^{(j)}\) como una mezcla factorial de gaussianas:

\[p(x^{(j)}) = \prod_i p_i (x_i^{(j)})\]

Las mezclas factoriales son una forma sencilla de crear distribuciones con una pequeña cantidad de parámetros y una gran cantidad de modos.

import tensorflow as tf
import numpy as np
import tensorflow_probability as tfp
import matplotlib.pyplot as plt
import seaborn as sns
tfd = tfp.distributions

# Use try/except so we can easily re-execute the whole notebook.
try:
  tf.enable_eager_execution()
except:
  pass

Construye la mezcla factorial de gaussianos usando TFP

num_vars = 2        # Number of variables (`n` in formula).
var_dim = 1         # Dimensionality of each variable `x[i]`.
num_components = 3  # Number of components for each mixture (`K` in formula).
sigma = 5e-2        # Fixed standard deviation of each component.

# Choose some random (component) modes.
component_mean = tfd.Uniform().sample([num_vars, num_components, var_dim])

factorial_mog = tfd.Independent(
   tfd.MixtureSameFamily(
       # Assume uniform weight on each component.
       mixture_distribution=tfd.Categorical(
           logits=tf.zeros([num_vars, num_components])),
       components_distribution=tfd.MultivariateNormalDiag(
           loc=component_mean, scale_diag=[sigma])),
   reinterpreted_batch_ndims=1)

Nótese el uso de tfd.Independent . Este "meta-distribución" se aplica un reduce_sum en el log_prob cálculo durante los más a la derecha reinterpreted_batch_ndims dimensiones lotes. En nuestro caso, esto resume a cabo las variables de la dimensión dejando sólo la dimensión del lote cuando calculamos log_prob . Tenga en cuenta que esto no afecta el muestreo.

Trazar la densidad

Calcule la densidad en una cuadrícula de puntos y muestre las ubicaciones de los modos con estrellas rojas. Cada modo en la mezcla factorial corresponde a un par de modos de la mezcla subyacente individual-variable de gaussianos. Podemos ver en 9 modos de la trama de abajo, pero sólo necesitaba 6 parámetros (3 para especificar la ubicación de los modos en \(x_1\), y 3 para especificar la ubicación de los modos en \(x_2\)). Por el contrario, una mezcla de distribución gaussianas en el espacio 2d \((x_1, x_2)\) requeriría 2 * 9 = 18 parámetros para especificar los 9 modos.

plt.figure(figsize=(6,5))

# Compute density.
nx = 250 # Number of bins per dimension.
x = np.linspace(-3 * sigma, 1 + 3 * sigma, nx).astype('float32')
vals = tf.reshape(tf.stack(np.meshgrid(x, x), axis=2), (-1, num_vars, var_dim))
probs = factorial_mog.prob(vals).numpy().reshape(nx, nx)

# Display as image.
from matplotlib.colors import ListedColormap
cmap = ListedColormap(sns.color_palette("Blues", 256))
p = plt.pcolor(x, x, probs, cmap=cmap)
ax = plt.axis('tight');

# Plot locations of means.
means_np = component_mean.numpy().squeeze()
for mu_x in means_np[0]:
  for mu_y in means_np[1]:
    plt.scatter(mu_x, mu_y, s=150, marker='*', c='r', edgecolor='none');
plt.axis(ax);

plt.xlabel('$x_1$')
plt.ylabel('$x_2$')
plt.title('Density of factorial mixture of Gaussians');

png

Trazar muestras y estimaciones de densidad marginal

samples = factorial_mog.sample(1000).numpy()

g = sns.jointplot(
    x=samples[:, 0, 0],
    y=samples[:, 1, 0],
    kind="scatter",
    marginal_kws=dict(bins=50))
g.set_axis_labels("$x_1$", "$x_2$");

png

Mezcla factorial Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Construye la mezcla factorial de gaussianos usando TFP

Trazar la densidad

Trazar muestras y estimaciones de densidad marginal

Mezcla factorial