Съдържание
Статистическият модел е математическа проекция, която съдържа набор от различни предположения за генерирането на някои извадкови данни. Терминът често се представя в значително идеализиран вид.
Предположенията, изразени в статистическия модел, показват набор от вероятностни разпределения. Много от тях се предполага, че правилно апроксимират разпределението, от което е взета извадка за определен набор от информация. Вероятностните разпределения, присъщи на статистическите модели, са това, което отличава прогнозата от други математически модификации.
Обща проекция

Математическият модел е описание на дадена система с помощта на специфични понятия и език. Те се прилагат В областта на природните науки (като физика, биология, науки за земята, химия) и инженерните науки (като компютърни науки, електротехника), както и в областта на социалните науки (като икономика, психология, социология, политически науки).
Моделът може да помогне да се обясни дадена система и да се изследват ефектите на различните компоненти, както и да се направят прогнози за поведението.
Математическите модели могат да приемат много форми, включително динамични системи, статистически прогнози, диференциални уравнения или теоретични параметри на игрите. Тези и други типове могат да се припокриват и този модел включва много абстрактни структури. Като цяло математическите прогнози могат да включват логически компоненти. В много случаи качеството на дадена научна област зависи от това доколко математическите модели, разработени в теоретичен план, съвпадат с резултатите от повторяеми експерименти. Липсата на съгласие между теоретичните процеси и експерименталните измервания често води до важни постижения, тъй като се разработват по-съвършени теории.
Във физическите науки традиционният математически модел съдържа много от следните елементи
- Управленски уравнения.
- Допълнителни подмодели.
- Определение на уравненията.
- Съставни уравнения.
- Предположения и ограничения.
- Начални и гранични условия.
- Класически ограничения и кинематични уравнения.
Формула
Статистическият модел обикновено се определя от математически уравнения, които комбинират една или повече случайни променливи и евентуално други редовни, нововъзникващи променливи. По същия начин проекцията се счита за "формално понятие за понятие".
Всички тестове на статистически хипотези и статистически оценки се получават от математически модели.
Въведение

Неофициално статистическият модел може да се разглежда като предположение (или набор от предположения) с определено свойство: той ни позволява да изчислим вероятността на всяко събитие. Като пример, разгледайте двойка обикновени шестстранни зарове. Трябва да се изследват две различни статистически предположения за заровете.
Първото предположение е следното:
Вероятността да се падне едно от числата (1, 2, 3, 4, 5 и 6) за всеки от заровете е 1/6.
Въз основа на това предположение можем да изчислим вероятността и за двата куба: 1:1/6×1/6=1/36.
В по-общ смисъл е възможно да се изчисли вероятността за всяко събитие. Въпреки това трябва да се разбере, че е невъзможно да се изчисли вероятността за всяко друго нетривиално събитие.
Само първото предположение събира статистически математически модел: защото само с едно предположение е възможно да се определи вероятността на всяко действие.
В горния пример с първоначалното предположение е лесно да се определи вероятността за дадено събитие. При някои други примери изчислението може да бъде трудно или дори нереалистично (например може да отнеме много години изчисления). За лице, което създава модел на статистически анализ, подобна сложност се счита за неприемлива: извършването на изчислението не трябва да бъде фактически неосъществимо или теоретично невъзможно.
Формално определение
В математически смисъл статистическият модел на дадена система обикновено се разглежда като двойка (S, P), където S е множеството от възможни наблюдения, т.е. пространството на извадките, а P е множеството от вероятностни разпределения върху S.
Интуицията зад това определение е. Предполага се, че има "истинско" разпределение на вероятностите, причинено от процес, който генерира определени данни.
Задайте
Той е този, който определя параметрите на модела. Параметризирането обикновено изисква различните стойности да водят до различни разпределения, t. е.

трябва да е валидна (с други думи, трябва да е инжективна). Параметризация, която отговаря на изискването, се нарича идентифицируема.
Пример:

Да предположим, че има няколко ученици на различна възраст. Височината на детето ще бъде стохастично свързана с годината на раждане: например, когато ученикът е на 7 години, това влияе на вероятността за височина, само че така, че човекът ще бъде по-висок от 3 см.
Можем да формализираме този подход в праволинеен регресионен модел, например: height i = b 0 + b 1agei + εi където b 0 е пресечната точка, b 1 е параметърът, с който се умножава възрастта, за да се получи мониторинг на височината. Това е термин за грешка. Това означава, че се приема, че растежът се прогнозира според възрастта с определена грешка.
Валидният формуляр трябва да отговаря на всички информационни точки. Така една пряка посока (ниво i = b 0 + b 1agei) не може да бъде уравнение за модел на данни - освен ако не отговаря ясно на абсолютно всички. Това означава, че цялата информация е напълно изложена на риск. участник в грешкаεi трябва да бъде въведено в уравнение, така че формата да съответства на абсолютно всички точки от данни.
За да направим статистически извод, първо трябва да приемем някои вероятностни разпределения за ε i. Например можем да предположим, че разпределенията ε имам Гаусова форма с нулева средна стойност. В този случай моделът ще има 3 параметъра: b 0, b 1 и дисперсията на Гаусовото разпределение.
Възможно е моделът да бъде формално определен под формата (S, P).
В този пример моделът се определя чрез посочване на S и следователно могат да се направят някои предположения, които са от значение за P. Има две възможности:
Този ръст може да се определи приблизително чрез линейна функция на възрастта;
Грешките в апроксимацията се разпределят като в рамките на Гаус.
Общи забележки
Статистическите модели са специален клас математически проекции. Какво отличава единия вид от другия? е, че статистическият модел не е детерминистичен. Така, за разлика от математическите уравнения, в него някои променливи нямат определени стойности, а имат разпределение на възможностите. Това означава, че някои променливи се считат за стохастични. В дадения по-рано пример ε е стохастична променлива. Без него прогнозата би била детерминистична.
Често се използват статистически модели, дори ако се приема, че материалният процес е детерминиран. Например хвърлянето на монета по принцип е детерминистично действие. Въпреки това той все още се моделира като стохастичен (чрез процес на Бернули).
Според Кониши и Китагава статистическият модел има три цели:
- Прогнози.
- Извличане на информация.
- Описание на стохастични структури.
Размер на прожекцията
Да предположим, че има статистически модел за прогнозиране,
Моделът се нарича параметричен, ако O има крайно измерение. В решението трябва да се запише, че

където k е цяло положително число (R означава всички реални числа). Тук k се нарича размерността на модела.
Като пример, приемете, че всички данни произтичат от едномерно Гаусово разпределение:

В този пример размерността на k е 2.
Като друг пример, да предположим, че данните се състоят от точки (x, y), за които се приема, че са разпределени по права линия с Гаусови остатъци (с нулева средна стойност). Тогава размерът на статистическия икономически модел е 3: пресечната точка на линията, нейният наклон и дисперсията на разпределението на остатъците. Нуждаете се от обръщайте внимание, че в геометрията правата линия има размер 1.
Въпреки че горната стойност формално е един параметър с размерност k, понякога тя се разглежда като съдържаща k отделни стойности. Например при едномерното Гаусово разпределение O е единичен параметър с размерност 2, но понякога се разглежда като съдържащ два отделни параметъра - средната стойност и стандартното отклонение.
Статистическият модел на даден процес е непараметричен, ако множеството от стойности O е безкрайно голямо. Той е също така полупараметричен, ако има както крайномерни, така и безкрайномерни параметри. Формално, ако k е размерността O и n е броят на извадките, полупараметричните и непараметричните модели имат

тогава моделът е полупараметричен. В противен случай проекцията е непараметрична.
Параметричните модели са най-често използваната статистика. По отношение на полупараметричните и непараметричните прогнози сър Дейвид Кокс заяви
"Те обикновено включват най-малко хипотези за структурата и формата на разпределението, но включват мощни теории за независимостта".
Вложени модели
не трябва да се бъркат с многостепенни проекции.
Два статистически модела са вложени, ако първият може да бъде трансформиран във втория чрез налагане на ограничения върху параметрите на първия. Например множеството на всички Гаусови разпределения има вложено множество от разпределения с нулева средна стойност:
Това означава, че трябва да се ограничи средната стойност в множеството от всички Гаусови разпределения, за да се получат разпределения с нулева средна стойност. Като втори пример може да се посочи квадратичният модел y = b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ2) има вложен в него линеен модел y = b0 + b1x + ε, ε ~ N (0, σ2) - т.е. параметърът b2 е равен на 0.
И в двата примера първият модел има по-голямо измерение от втория модел. Това често, но не винаги, е така. Друг пример е множеството на Гаусовите разпределения с положителна средна стойност, което има размерност 2.
Сравнение на моделите

Предположението е, че в основата на наблюдаваните данни стои "истинско" вероятностно разпределение, предизвикано от процеса, който ги е генерирал.
Моделите могат да бъдат сравнявани помежду си чрез проучвателен или потвърдителен анализ. При проучвателния анализ се формулират различни модели и се оценява доколко добре всеки от тях описва данните. При потвърдителния анализ предварително формулираната хипотеза се сравнява с първоначалната хипотеза. Общите критерии за това включват Р2, Байесов фактор и относителна вероятност.
Мисълта на Кониши и Китагава
"Повечето проблеми на статистическите математически модели могат да се разглеждат като проблеми, свързани с прогнозирането. Обикновено те се формулират като сравнение на няколко фактора.
Освен това сър Дейвид Кокс заяви: "Като превод от темата, проблемът в статистическия модел най-често е най- важна част анализ".