stockpricepred.py

import streamlit as st
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow import keras
import tensorflow.keras.backend
import pandas_datareader as web
from sklearn.preprocessing import MinMaxScaler
import yfinance as yf

# Set page configuration as the first Streamlit command
st.set_page_config(
    page_title="Conjexure | HOME",
    page_icon="📈",
)

# cover image used and streamlit function call to display image
image_path = ('image.jpeg')
st.image(image_path, use_column_width=True)

# basic title and markdown
st.title("Conjexure ~ Stock Price Forecasting 📈")
st.header("Welcome to Conjexure!")
st.markdown(
    "In this Machine Learning application, we have used the historical stock price data for Alphabet (GOOG) and Apple Inc. (AAPL) to forecast their price in a specified future window.")
st.markdown(
    "We have used the Tensorflow and Keras APIs to build a stacked LSTM model with a convolutional as well as a lambda layer. We trained our model on a roughly 2 year period from July 1st, 2021 through July 1st, 2023.")

path_goog = ('data_goog.csv')
path_aapl = ('data_aapl.csv')


# function to load separate models on the basis of user choice
def load_model(forecast_window):
    if forecast_window == '1 week':
        model = keras.models.load_model('Experiments NB/Model1_pred_7days.h5')
    elif forecast_window == '2 weeks':
        model = keras.models.load_model('Experiments NB/Model2_pred_14days.h5')
    elif forecast_window == '3 weeks':
        model = keras.models.load_model('Experiments NB/Model_3_Pred21_Days.h5')
    elif forecast_window == '4 weeks':
        model = keras.models.load_model('Experiments NB/Model_4_Pred28_Days.h5')
    elif forecast_window == '5 weeks':
        model = keras.models.load_model('Experiments NB/Model5_Pred_35Days.h5')

    # model._make_predict_function()
    model.summary()
    return model


def load_model_app(forecast_window):
    if forecast_window == '1 week':
        model = keras.models.load_model('Experiments NB/Apple-Model-TransferLearning/apple-7.h5')
    elif forecast_window == '2 weeks':
        model = keras.models.load_model('Experiments NB/Apple-Model-TransferLearning/apple-14.h5')
    elif forecast_window == '3 weeks':
        model = keras.models.load_model('Experiments NB/Apple-Model-TransferLearning/apple-21.h5')
    elif forecast_window == '4 weeks':
        model = keras.models.load_model('Experiments NB/Apple-Model-TransferLearning/apple-28.h5')
    elif forecast_window == '5 weeks':
        model = keras.models.load_model('Experiments NB/Apple-Model-TransferLearning/apple-35.h5')

    # model._make_predict_function()
    model.summary()
    return model

# function to load data from dataset
@st.cache_data(persist=True)
def load_data(path, nrows):
    data = pd.read_csv(filepath_or_buffer=path, nrows=nrows)
    return data

# simple mapping function to map forecast input strings to relevant integers
def mapper(forecast_window):
    if forecast_window == '1 week':
        return 7
    elif forecast_window == '2 weeks':
        return 14
    elif forecast_window == '3 weeks':
        return 21
    elif forecast_window == '4 weeks':
        return 28
    elif forecast_window == '5 weeks':
        return 35


# windowing functions

def windowed_dataset(series, window_size=31, predday=7, batch_size=32, shuffle_buffer=1000):
    ds = tf.data.Dataset.from_tensor_slices(series)
    ds = ds.window(window_size + predday, shift=1, drop_remainder=True)
    ds = ds.flat_map(lambda w: w.batch(window_size + predday))
    ds = ds.shuffle(shuffle_buffer)
    ds = ds.map(lambda w: (w[:-7], tf.squeeze(w[-7:])))
    return ds.batch(batch_size).prefetch(3)


def windowed_dataset1(series, window_size=62, predday=14, batch_size=32, shuffle_buffer=1000):
    ds = tf.data.Dataset.from_tensor_slices(series)
    ds = ds.window(window_size + predday, shift=1, drop_remainder=True)
    ds = ds.flat_map(lambda w: w.batch(window_size + predday))
    ds = ds.shuffle(shuffle_buffer)
    ds = ds.map(lambda w: (w[:-14], tf.squeeze(w[-14:])))
    return ds.batch(batch_size).prefetch(3)


def windowed_dataset2(series, window_size=90, predday=21, batch_size=32, shuffle_buffer=1000):
    ds = tf.data.Dataset.from_tensor_slices(series)
    ds = ds.window(window_size + predday, shift=1, drop_remainder=True)
    ds = ds.flat_map(lambda w: w.batch(window_size + predday))
    ds = ds.shuffle(shuffle_buffer)
    ds = ds.map(lambda w: (w[:-21], tf.squeeze(w[-21:])))
    return ds.batch(batch_size).prefetch(3)


def windowed_dataset3(series, window_size=120, predday=28, batch_size=32, shuffle_buffer=1000):
    ds = tf.data.Dataset.from_tensor_slices(series)
    ds = ds.window(window_size + predday, shift=1, drop_remainder=True)
    ds = ds.flat_map(lambda w: w.batch(window_size + predday))
    ds = ds.shuffle(shuffle_buffer)
    ds = ds.map(lambda w: (w[:-28], tf.squeeze(w[-28:])))
    return ds.batch(batch_size).prefetch(3)


def windowed_dataset4(series, window_size=150, predday=35, batch_size=32, shuffle_buffer=1000):
    ds = tf.data.Dataset.from_tensor_slices(series)
    ds = ds.window(window_size + predday, shift=1, drop_remainder=True)
    ds = ds.flat_map(lambda w: w.batch(window_size + predday))
    ds = ds.shuffle(shuffle_buffer)
    ds = ds.map(lambda w: (w[:-35], tf.squeeze(w[-35:])))
    return ds.batch(batch_size).prefetch(3)


# plotting function to plot the final forecast line graph

def plot_graph(forecast, forecast_window_int, a):

    if forecast_window_int == 7:
        plt.plot(np.arange(0, 31), scaler1.inverse_transform(a[0]))
        plt.plot(np.arange(31, 38), scaler1.inverse_transform(forecast)[0], "-")

    elif forecast_window_int == 14:
        plt.plot(np.arange(1, 63),scaler1.inverse_transform(a[0]))
        plt.plot(np.arange(63, 77), scaler1.inverse_transform(forecast)[0], "-")

    elif forecast_window_int == 21:
        plt.plot(np.arange(1, 91), scaler1.inverse_transform(a[0]))
        plt.plot(np.arange(91, 112), scaler1.inverse_transform(forecast)[0], "-")

    elif forecast_window_int == 28:
        plt.plot(np.arange(1, 121), scaler1.inverse_transform(a[0]))
        plt.plot(np.arange(121, 149), scaler1.inverse_transform(forecast)[0], "-")

    elif forecast_window_int == 35:
        plt.plot(np.arange(1, 151), scaler1.inverse_transform(a[0]))
        plt.plot(np.arange(151, 186), scaler1.inverse_transform(forecast)[0], "-")

    plt.legend(["Actual Days", "Prediction"])
    plt.title('Prediction for next {} Days'.format(forecast_window_int))
    st.pyplot(plt)


def future_predicted(testbatches, window_size, predday):
    x, y = next(iter(testbatches))
    output = model.predict(x)

    time = list(range(1, window_size + 1))
    time2 = list(range(window_size + 1, window_size + predday + 1))
    plt.plot(time, x[0])
    plt.plot(time2, output[0])
    plt.legend(['Actual Values', 'Predicted Values'])
    plt.title('Prediction for {} Days'.format(predday))

    st.pyplot(plt)


# main function
if __name__ == "__main__":
    st.markdown(
        "You may go over the raw data for Alphabet or Apple. Just go to the sidebar and select your stock of choice. We have used the closing price as the generic price. ")
    choice = st.selectbox("Show Raw Data", ['Alphabet (GOOG)', 'Apple (APPL)'])
    if choice == 'Alphabet (GOOG)':
        data = load_data(path_goog, 4000)
        st.write(data)
    elif choice == 'Apple (APPL)':
        data = load_data(path_aapl, 4000)
        st.write(data)
    image_path = ('stonks.png')
    st.image(image_path, use_column_width=True)
    # Dropdown Menu to Choose Company Stock
    st.subheader("Choose from Apple Inc. (AAPL) and Alphabet Inc. (GOOG) to predict their future stock prices.")
    stock_choice = st.selectbox("Choice of Company Stock", ['Alphabet (GOOG)', 'Apple (AAPL)'])

    # st.subheader("Select the period (1-5 weeks) into the future for when you would like to see the forecast: ")
    # forecast_window = st.selectbox("Choice of Future Forecast Period", ['1 week','2 weeks','3 weeks','4 weeks','5 weeks'])

    if stock_choice == 'Alphabet (GOOG)':
        # Reading the data
        df_test = yf.download('GOOGL', start='2021-07-01', end='2023-10-27')

        # Displaying historical data for Alphabet
        st.subheader("Graph of Alphabet Inc.'s Historical Stock Prices")
        st.line_chart(df_test['Close'])

        # Inputting forecast window
        st.subheader(
            "Select the period (1-5 weeks) into the future for when you would like to see %s's forecast: " % stock_choice)
        forecast_window = st.selectbox("Choice of Future Forecast Period",['1 week', '2 weeks', '3 weeks', '4 weeks', '5 weeks'])
        forecast_window_int = mapper(forecast_window)

        # Choosing the closing data and reshaping into input shape
        x_test = df_test['Close']
        x_test = np.array(x_test).reshape(-1, 1)

        # Scaling and windowing the input
        scaler1 = MinMaxScaler(feature_range=(0, 0.75))
        xt1 = scaler1.fit_transform(x_test)

        if forecast_window_int == 7:

            xt = windowed_dataset(xt1, predday=7)


        elif forecast_window_int == 14:

            xt = windowed_dataset1(xt1, predday=14)

        elif forecast_window_int == 21:
            xt = windowed_dataset2(xt1, predday=21)

        elif forecast_window_int == 28:
            xt = windowed_dataset3(xt1, predday=28)

        else:
            xt = windowed_dataset4(xt1, predday=35)

        a, b = next(iter(xt))

        # load that model which is asked by the user and predict based on given timestep
        model = load_model(forecast_window)
        forecast = model.predict(a)


    elif stock_choice == 'Apple (AAPL)':

        # Reading the data
        df_test = yf.download('AAPL', start='2021-07-01', end='2023-10-27')

        # Displaying historical data for Alphabet
        st.subheader("Graph of Apple Inc.'s Historical Stock Prices")
        st.line_chart(df_test['Close'])

        # Inputting forecast window
        st.subheader(
            "Select the period (1-5 weeks) into the future for when you would like to see %s's forecast: " % stock_choice)
        forecast_window = st.selectbox("Choice of Future Forecast Period",['1 week', '2 weeks', '3 weeks', '4 weeks', '5 weeks'])
        forecast_window_int = mapper(forecast_window)

        # Choosing the closing data and reshaping into input shape
        x_test = df_test['Close']
        x_test = np.array(x_test).reshape(-1, 1)

        # Scaling and windowing the input
        scaler1 = MinMaxScaler(feature_range=(0, 0.75))
        xt1 = scaler1.fit_transform(x_test)

        if forecast_window_int == 7:
            xt = windowed_dataset(xt1, predday=7)

        elif forecast_window_int == 14:

            xt = windowed_dataset1(xt1, predday=14)

        elif forecast_window_int == 21:
            xt = windowed_dataset2(xt1, predday=21)

        elif forecast_window_int == 28:
            xt = windowed_dataset3(xt1, predday=28)

        else:
            xt = windowed_dataset4(xt1, predday=35)

        a, b = next(iter(xt))

        # load that model which is asked by the user and predict based on given timestep

        model = load_model_app(forecast_window)
        forecast = model.predict(a)

    # Plotting of future forecast graph
    st.subheader("Future forecast for %s for a period of %s after 20th July, 2023:" % (stock_choice, forecast_window))

    plot_graph(forecast, forecast_window_int, a)