from matplotlib import pyplot as plt
import pandas as pd
import numpy as np
from scipy import stats

xs = [5,7,8,7,2,17,2,9,4,11,12,9,6]
ys = [99,86,87,88,111,86,103,87,94,78,77,85,86]

m, b, _, _, _ = stats.linregress(xs, ys)

plt.scatter(xs, ys)
plt.plot(xs, [m * x + b for x in xs])
plt.show()

errors = [(m * xs[i] + b - ys[i]) ** 2 for i in range(len(xs))]
print(errors)

[np.float64(21.626948352384407), np.float64(23.49288828029534), np.float64(4.39178485240792), np.float64(8.1051031441658), np.float64(129.88283706421814), np.float64(160.4258038281837), np.float64(11.536994532945045), np.float64(0.11859128985571113), np.float64(4.413400213657534), np.float64(34.12657393735711), np.float64(25.91326891120767), np.float64(5.496074733564338), np.float64(43.53669186049348)]

print(sum(errors))

473.0669610007362

import random

pt = int(random.random() * len(xs))

# I had Gemini do this.

m = (ys[pt] - ys[pt - 1]) / (xs[pt] - xs[pt - 1])
b = ys[pt] - m * xs[pt]
pt, m, b

(1, -6.5, 131.5)

# you don't need to know how to do write this, but we had a lecture on how you could understand it.

get_m = lambda pt1, pt2 : (ys[pt1] - ys[pt2]) / (xs[pt1] - xs[pt2])

get_mb = lambda pt1, pt2 : (get_m(pt1,pt2),  ys[pt1] - get_m(pt1,pt2) * xs[pt1])

mbs = [get_mb(pt1,pt2) for pt2 in range(len(xs)) for pt1 in range(len(xs)) if xs[pt1] != xs[pt2]]
print(max(mbs), min(mbs))

(5.0, 74.0) (-13.0, 164.0)

ms = [mb[0] for mb in mbs]
bs = [mb[1] for mb in mbs]
print('ms', min(ms), max(ms))
print('bs', min(bs), max(bs))

ms -13.0 5.0
bs 55.4 164.0

sse = lambda m, b : sum([(m * xs[i] + b - ys[i]) ** 2 for i in range(len(xs))]) # S um of S quare E rror
print(sse(5,55.4), sse(-13,164.0))

10181.480000000001 34904.0

sses = [[sse(m, b) for m in range(-13,6)] for b in range(55,165)]

print(max([max(i) for i in sses]), min([min(i) for i in sses]))

259553 486

import pandas as pd
import numpy as py
from PIL import Image as im

df = pd.DataFrame(sses)
df.head()

im.fromarray(np.array(sses).astype(np.uint8))

im.fromarray(np.array([[i//(259553//255) for i in j] for j in sses]).astype(np.uint8))

259553 ** .5

509.4634432420053

im.fromarray(np.array([[(i**.5)//2 for i in j] for j in sses]).astype(np.uint8))

# prompt: plotly 3d surface plot of sses

import plotly.graph_objects as go
import plotly.io as pio # this stuff is just for the website
pio.renderers.default='notebook' # this stuff is just for the website

# Create the surface plot
fig = go.Figure(data=[go.Surface(z=sses)])

# Customize the plot
fig.update_layout(title='Sum of Squared Errors',
                  scene=dict(
                      xaxis_title='m',
                      yaxis_title='b',
                      zaxis_title='SSE'
                  ))

# Display the plot
fig

import math

go.Figure(data=[go.Surface(x=list(range(-13,6)),y=list(range(55,165)),z=[[math.log(i) for i in j] for j in sses])])

im.fromarray(np.array([[math.log(i)*15 for i in j] for j in sses]).astype(np.uint8))

im.fromarray(np.array([[math.log(sses[-j][i//5])*20 for i in range(len(sses[0]) * 5)] for j in range(len(sses))]).astype(np.uint8))

# Grabbing this from earlier - sses = [[sse(m, b) for m in range(-13,6)] for b in range(55,165)]

x = 11
y = 51

m = x - 13 # we started at -13, and didn't tell plotly. whoops.
b = y + 55

errors = [(m * xs[i] + b - ys[i]) ** 2 for i in range(len(xs))]
print(sum(errors)) # best possible was 473.0669610007362

499

m_stat, b_stat, _, _, _ = stats.linregress(xs, ys)
print(m_stat, b_stat)
print(m,b)

-1.7512877115526118 103.10596026490066
-2 106

	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18
0	259553	229326	201025	174650	150201	127678	107081	88410	71665	56846	43953	32986	23945	16830	11641	8378	7041	7630	10145
1	256088	226059	197956	171779	147528	125203	104804	86331	69784	55163	42468	31699	22856	15939	10948	7883	6744	7531	10244
2	252649	222818	194913	168934	144881	122754	102553	84278	67929	53506	41009	30438	21793	15074	10281	7414	6473	7458	10369
3	249236	219603	191896	166115	142260	120331	100328	82251	66100	51875	39576	29203	20756	14235	9640	6971	6228	7411	10520
4	245849	216414	188905	163322	139665	117934	98129	80250	64297	50270	38169	27994	19745	13422	9025	6554	6009	7390	10697

Example¶

Errors¶

Calculate Sums¶

Machine Learning¶

Aside¶

ms & bs¶

Brute force¶

Clarification¶

Look at it!¶

Images¶

Colors¶

Square Root¶

Plotly¶

Logs¶

Images, Again¶

Line them up¶

Machine Learning¶

Gradient Descent¶

Check our work...¶