import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats

np.random.seed(123)

import warnings
warnings.filterwarnings('ignore')

class sampling_method(object):
    
    def __init__(self):
        pass
    
    def fit(self, data, sigma_true, mu_prior_mu, sigma_prior_mu, mu_init, samples, proposal_width, plot, x=None):
        mu_current = mu_init
        posterior = [mu_current]
        for i in range(samples):

            mu_proposal = stats.norm(mu_current, proposal_width).rvs()

            likelihood_current = stats.norm(mu_current, 1).pdf(data).prod()
            likelihood_proposal = stats.norm(mu_proposal, 1).pdf(data).prod()

            prior_current = stats.norm(mu_prior_mu, sigma_prior_mu).pdf(mu_current)
            prior_proposal = stats.norm(mu_prior_mu, sigma_prior_mu).pdf(mu_proposal)

            p_current = likelihood_current * prior_current
            p_proposal = likelihood_proposal * prior_proposal

            p_accept = p_proposal / p_current

            accept = np.random.rand() < p_accept

            if plot:
                self.plot_proposal(mu_current, mu_proposal, mu_prior_mu, sigma_prior_mu, sigma_true, data, accept, posterior, i, x)

            if accept:
                mu_current = mu_proposal

            posterior.append(mu_current)

        return posterior

    def plot_proposal(self, mu_current, mu_proposal, mu_prior_mu, sigma_prior_mu, sigma_true, data, accepted, trace, i, x):
        from copy import copy
        trace = copy(trace)
        
        fig, (ax1, ax2, ax3, ax4) = plt.subplots(ncols=4, figsize=(16, 4))
        fig.suptitle('Iteration %i' % (i + 1))
        color = 'g' if accepted else 'r'

        prior_current = stats.norm(mu_prior_mu, sigma_prior_mu).pdf(mu_current)
        prior_proposal = stats.norm(mu_prior_mu, sigma_prior_mu).pdf(mu_proposal)
        prior = stats.norm(mu_prior_mu, sigma_prior_mu).pdf(x) # 为了求它，因此需要传这些参数
        ax1.plot(x, prior)
        ax1.plot([mu_current] * 2, [0, prior_current], marker='o', color='b')
        ax1.plot([mu_proposal] * 2, [0, prior_proposal], marker='o', color=color)
        ax1.annotate("", xy=(mu_proposal, 0.2), xytext=(mu_current, 0.2),
                     arrowprops=dict(arrowstyle="->", lw=2.))
        ax1.set(ylabel='Probability Density', title='current: prior(mu=%.2f) = %.2f\nproposal: prior(mu=%.2f) = %.2f' % (mu_current, prior_current, mu_proposal, prior_proposal))

        likelihood_current = stats.norm(mu_current, sigma_true).pdf(data).prod()
        likelihood_proposal = stats.norm(mu_proposal, sigma_true).pdf(data).prod()
        y = stats.norm(loc=mu_proposal, scale=sigma_true).pdf(x)
        sns.distplot(data, kde=False, norm_hist=True, ax=ax2)
        ax2.plot(x, y, color=color)
        ax2.axvline(mu_current, color='b', linestyle='--', label='mu_current')
        ax2.axvline(mu_proposal, color=color, linestyle='--', label='mu_proposal')
        ax2.annotate("", xy=(mu_proposal, 0.2), xytext=(mu_current, 0.2),
                     arrowprops=dict(arrowstyle="->", lw=2.))
        ax2.set(title='likelihood(mu=%.2f) = %.2f\nlikelihood(mu=%.2f) = %.2f' % (mu_current, 1e14*likelihood_current, mu_proposal, 1e14*likelihood_proposal))

        posterior_analytical = self.calc_posterior_analytical(data, x, mu_prior_mu, sigma_prior_mu)
        ax3.plot(x, posterior_analytical)
        posterior_current = self.calc_posterior_analytical(data, mu_current, mu_prior_mu, sigma_prior_mu)
        posterior_proposal = self.calc_posterior_analytical(data, mu_proposal, mu_prior_mu, sigma_prior_mu)
        ax3.plot([mu_current] * 2, [0, posterior_current], marker='o', color='b')
        ax3.plot([mu_proposal] * 2, [0, posterior_proposal], marker='o', color=color)
        ax3.annotate("", xy=(mu_proposal, 0.2), xytext=(mu_current, 0.2),
                     arrowprops=dict(arrowstyle="->", lw=2.))
        ax3.set(title='posterior(mu=%.2f) = %.5f\nposterior(mu=%.2f) = %.5f' % (mu_current, posterior_current, mu_proposal, posterior_proposal))

        if accepted:
            trace.append(mu_proposal)
        else:
            trace.append(mu_current)
            
        ax4.plot(trace)
        ax4.set(xlabel='iteration', ylabel='mu', title='trace')
        plt.tight_layout()

    def calc_posterior_analytical(self, data, x, mu_0, sigma_0):
        sigma = 1.
        n = len(data)
        mu_post = (mu_0 / sigma_0**2 + data.sum() / sigma**2) / (1. / sigma_0**2 + n / sigma**2)
        sigma_post = (1. / sigma_0**2 + n / sigma**2)**-1
        return stats.norm(mu_post, np.sqrt(sigma_post)).pdf(x)

### 样本分布的假设 正态
mu_true = 1.5
sigma_true = 2
data = stats.norm.rvs(mu_true, sigma_true, size=200)

### mu的先验分布设置 正态
mu_prior_mu = 0.5
sigma_prior_mu = 1

### mu更新的初始值设置
mu_init = 0  

### 采样法的其它参数
samples = 120  ### 被采样的次数
proposal_width = 0.5
plot = True
x = np.linspace(-5, 5, 5000)


sm = sampling_method()
sm.fit(data, sigma_true, mu_prior_mu, sigma_prior_mu, mu_init, samples, proposal_width, plot, x);

简介¶

采样法¶