Анализ рынка фильмов
Реферат, 02 Ноября 2011, автор: пользователь скрыл имя
Описание работы
Цель и задачи исследования. Целью исследования является выявление зависимости между мировыми кассовыми сборами на зарубежные фильмы, появившиеся в широком прокате в период с 2006 по 2008 годы, и факторами, которые непосредственно влияют на данные сборы. В качестве таких факторов исследователи выбрали следующие:
количественные
Бюджет фильма
Количество известных актеров (известность будет оцениваться исходя из рейтингов)
Продолжительность показа фильма(надели)
Максимальное число кинотеатров
Содержание
Введение..................................................................................................................3
Глава 1. Данные......................................................................................................5
Описание данных.........................................................................................5
Предварительный анализ данных..............................................................8
Графическое представление зависимости кассовых
сборов зарубежных фильмов от основных факторов....................................10
Глава 2. Поиск эконометрической модели..........................................................11
2.1 Линейная модель.........................................................................................11
2.2 Полулогарифмическая модель...................................................................16
2.3 Логарифмическая модель...........................................................................16
2.4 Оригинальная модель.................................................................................17
2.5 Анализ модели на устойчивость................................................................18
Глава 3. Оценка адекватности итоговой модели и возможные
способы ее улучшения...........................................................................................21
3.1 Улучшение эффективности оценок. Двухшаговая процедура...............21
3.2 Выводы.........................................................................................................23
Заключение.............................................................................................................24
Приложения............................................................................................................26
Работа содержит 1 файл
Анализ мировых кассовых сборов зарубежных фильмов.doc
— 1.80 Мб (Скачать)Таблица 1. Основные исследуемые показатели
При
последовательном изучении информации
взято 200 наблюдений. Ниже представлены
причины, по которым собранные данные
были учтены в дальнейшем анализе не полностью:
- Пробелы в данных (большинство) – отсутствие информации о бюджете фильма, кассовом сборе, продолжительности показа и максимальном числе кинотеатров;
- Критические случаи – слишком большой разброс бюджета и кассовых сборов.
Приведем основные статистики по анализируемым показателям
| MAX | BUD | TIME | ACTOR | |
| Mean | 2080.215 | 45549325 | 11.42900 | 1.040000 |
| Median | 2459.000 | 30000000 | 11.00000 | 1.000000 |
| Maximum | 4362.000 | 3.00E+08 | 35.30000 | 5.000000 |
| Minimum | 1.000000 | 15000.00 | 0.400000 | 0.000000 |
| Std. Dev. | 1311.228 | 47962368 | 6.437567 | 1.060198 |
Таблица 2.1. Статистика по количественным показателям
Из таблицы видно, что средний бюджет зарубежного фильма составляет примерно 45,5 млн $. Продолжительность фильма составляет в среднем примерно 11 с половиной недель, и в среднем в каждом фильме снимается 1 известный актер. Максимальное количество кинотеатров в среднем перешагивает отметку 2000.
| FANTA | FIGHT | THR | PRE | SEASON | STATE | ADV | CAR | COM | DIRECTOR | DRAMA | |
| Mean | 0.150 | 0.175 | 0.295 | 0.100 | 0.400 | 0.835 | 0.135 | 0.075 | 0.280 | 0.390 | 0.395 |
Более
80% фильмов выборки произведены
в США (скорее всего будет незначимым),
примерно 40% картин снимают известные
режиссеры. И основным жанром является
драма (почти 40%). Примерно 30% фильмов снимаются
в жанре Триллер.
1.2.Предварительный анализ данных
Для того чтобы сформулировать основные гипотезы относительно влияния факторов (в том числе, гипотезы о значимости влияния) и проверить догадки, проанализируем корреляционную матрицу (Таблица 2). Кроме этого, ее анализ даст возможность подтвердить предварительные предположения относительно мультиколлинеарности признаков.
| ACTOR | ADV | BUD | CAR | COM | DIRECTOR | DRAMA | FANTA | FIGHT | MAX | PRE | TIME | SEASON | STATE | THR | |
| ACTOR | 1,000 | 0,137 | 0,397 | -0,029 | 0,061 | 0,241 | -0,050 | 0,077 | -0,017 | 0,275 | 0,066 | 0,082 | 0,104 | 0,170 | 0,141 |
| ADV | 0,137 | 1,000 | 0,444 | 0,110 | -0,051 | 0,074 | -0,170 | 0,285 | 0,319 | 0,264 | 0,161 | 0,147 | 0,096 | 0,018 | -0,063 |
| BUD | 0,397 | 0,444 | 1,000 | 0,252 | 0,016 | 0,071 | -0,289 | 0,350 | 0,255 | 0,665 | 0,336 | 0,284 | 0,167 | 0,165 | 0,104 |
| CAR | -0,029 | 0,110 | 0,252 | 1,000 | 0,161 | -0,072 | -0,191 | 0,040 | -0,031 | 0,243 | 0,032 | 0,129 | 0,155 | 0,075 | -0,184 |
| COM | 0,061 | -0,051 | 0,016 | 0,161 | 1,000 | -0,042 | -0,026 | -0,137 | -0,229 | 0,178 | -0,022 | 0,118 | 0,105 | 0,157 | -0,355 |
| DIRECTOR | 0,241 | 0,074 | 0,071 | -0,072 | -0,042 | 1,000 | 0,130 | 0,037 | -0,045 | 0,019 | -0,027 | 0,035 | 0,038 | 0,079 | 0,135 |
| DRAMA | -0,050 | -0,170 | -0,289 | -0,191 | -0,026 | 0,130 | 1,000 | -0,168 | -0,238 | -0,366 | -0,201 | -0,122 | 0,050 | -0,137 | -0,186 |
| FANTA | 0,077 | 0,285 | 0,350 | 0,040 | -0,137 | 0,037 | -0,168 | 1,000 | 0,175 | 0,229 | 0,047 | 0,043 | 0,000 | 0,036 | -0,057 |
| FIGHT | -0,017 | 0,319 | 0,255 | -0,031 | -0,229 | -0,045 | -0,238 | 0,175 | 1,000 | 0,182 | 0,197 | -0,046 | -0,027 | -0,043 | 0,135 |
| MAX | 0,275 | 0,264 | 0,665 | 0,243 | 0,178 | 0,019 | -0,366 | 0,229 | 0,182 | 1,000 | 0,287 | 0,278 | 0,054 | 0,364 | 0,140 |
| PRE | 0,066 | 0,161 | 0,336 | 0,032 | -0,022 | -0,027 | -0,201 | 0,047 | 0,197 | 0,287 | 1,000 | 0,057 | 0,068 | 0,103 | 0,077 |
| TIME | 0,082 | 0,147 | 0,284 | 0,129 | 0,118 | 0,035 | -0,122 | 0,043 | -0,046 | 0,278 | 0,057 | 1,000 | 0,123 | 0,020 | -0,012 |
| SEASON | 0,104 | 0,096 | 0,167 | 0,155 | 0,105 | 0,038 | 0,050 | 0,000 | -0,027 | 0,054 | 0,068 | 0,123 | 1,000 | 0,060 | -0,125 |
| STATE | 0,170 | 0,018 | 0,165 | 0,075 | 0,157 | 0,079 | -0,137 | 0,036 | -0,043 | 0,364 | 0,103 | 0,020 | 0,060 | 1,000 | 0,051 |
| THR | 0,141 | -0,063 | 0,104 | -0,184 | -0,355 | 0,135 | -0,186 | -0,057 | 0,135 | 0,140 | 0,077 | -0,012 | -0,125 | 0,051 | 1,000 |
Таблица
3. Матрица корреляций
| SB | |
| ACTOR | 0.332711 |
| ADV | 0.416024 |
| BUD | 0.818703 |
| CAR | 0.267647 |
| COM | 0.068779 |
| DIRECTOR | 0.044159 |
| DRAMA | -0.291681 |
| FANTA | 0.195107 |
| FIGHT | 0.174537 |
| MAX | 0.641668 |
| PRE | 0.390612 |
| TIME | 0.451627 |
| SEASON | 0.138337 |
| STATE | 0.172345 |
| THR | 0.091926 |
Проанализируем полученные значения корреляционной матрицы:
- Существует высокая корреляция между бюджетом и максимальным числом кинотеатров (0,66), что наводит на мысль о наличии мультиколлинеарности между этими регрессорами.
На
практике связь между этими двумя
переменными не является явной. В
ходе разработки модели было предложено
использование новой переменной
log(MAX). Проверим, есть ли существенная
зависимость между ней и бюджетом.
| LNMAX | SB | |
| LNMAX | 1 | 0.409866168261 |
| SB | 0.409866168261 | 1 |
Значение
0,41 позволяет говорить об «умеренной»
зависимости между двумя
- Самая высокая корреляция с кассовыми сборами фильмов – у бюджета и максимального числа кинотеатров (0,82 и 0,64 соответственно).
- Достаточно высокая зависимость есть между кассовыми сборами и продолжительностью показа (0,45). Менее коррелированны со сборами жанры фильмов: только Приключения имеют высокую корреляцию (0,41). Стоит также отметить возможную зависимость сборов от количества известных актеров, снявшихся в картине (0,33), и от наличия приквелов (0,39).
Таким
образом, мы предполагаем, что факторами,
значимо влияющими на величину кассовых
сборов зарубежных фильмов, являются
бюджет, максимальное число кинотеатров,
продолжительность показа, наличие известных
актеров, наличие приквела, жанр «приключение».
1.3.
Графическое представление
зависимости кассовых
сборов зарубежных фильмов
от основных факторов.
Рисунок 2. зависимость кассовых сборов зарубежных фильмов от количественных факторов.
Рисунок 2 содержит графическое
представление зависимости
Таким
образом, исследователями были выбраны
факторы, наиболее значимо влияющие
на сборы фильмов. Перейдем к поиску
эконометрической модели.
Глава 2. Поиск эконометрической модели
2.1. Линейная модель
Данная глава посвящена построению и оценке моделей, а также, выявлению наиболее адекватной из них. Рассмотрим основные типы моделей, а именно: линейную, логарифмическую и полулогарифмическую, а также предложим свою оригинальную модель.
Для начала построим линейную модель, включив в нее все имеющиеся переменные:
SB = C(1) + C(2)*BUD + C(3)*ACTOR
+ C(4)*TIME + C(5)*MAX + C(6)*ADV + C(7)*PRE + C(8)*CAR + C(9)*COM +
C(10)*DIRECTOR + C(11)*DRAMA + C(12)*FANTA + C(13)*FIGHT + C(14)*SEASON
+ C(15)*STATE + C(16)*THR
| Dependent Variable: SB | ||||
| Method: Least Squares | ||||
| Date: 05/18/08 Time: 19:31 | ||||
| Sample: 1 200 | ||||
| Included observations: 200 | ||||
| Variable | Coefficient | Std. Error | t-Statistic | Prob. |
| C | -87356186 | 24050108 | -3.632257 | 0.0004 |
| BUD | 2.305123 | 0.224880 | 10.25045 | 0.0000 |
| ACTOR | 5230277. | 7107703. | 0.735860 | 0.4628 |
| TIME | 6227264. | 1088265. | 5.722196 | 0.0000 |
| MAX | 15546.52 | 7622.119 | 2.039658 | 0.0428 |
| ADV | 46661830 | 22400288 | 2.083091 | 0.0386 |
| PRE | 78523004 | 23597280 | 3.327629 | 0.0011 |
| CAR | 34072723 | 27314557 | 1.247420 | 0.2138 |
| COM | -1998791. | 17041176 | -0.117292 | 0.9068 |
| DIRECTOR | -5188663. | 14099403 | -0.368006 | 0.7133 |
| DRAMA | -4261813. | 15279910 | -0.278916 | 0.7806 |
| FANTA | -43224393 | 20446413 | -2.114033 | 0.0359 |
| FIGHT | -16672298 | 19533884 | -0.853507 | 0.3945 |
| SEASON | -8698813. | 13865034 | -0.627392 | 0.5312 |
| STATE | 2166866. | 19290794 | 0.112326 | 0.9107 |
| THR | 4104583. | 16964467 | 0.241952 | 0.8091 |
| R-squared | 0.762580 | Mean dependent var | 1.29E+08 | |
| Adjusted R-squared | 0.743226 | S.D. dependent var | 1.81E+08 | |
| S.E. of regression | 91604914 | Akaike info criterion | 39.58049 | |
| Sum squared resid | 1.54E+18 | Schwarz criterion | 39.84435 | |
| Log likelihood | -3942.049 | F-statistic | 39.39997 | |
| Durbin-Watson stat | 2.144451 | Prob(F-statistic) | 0.000000 | |
Модель
1.1
На основе проверки гипотез о значимости каждого коэффициента и уравнения в целом (t-статистики и F-статистика), можно сделать следующие выводы: всего 7 переменных (включая константу) оказались значимыми. Четыре из них на 1% уровне значимости (tкрит.=2,576), три фактора на 5 % уровне (tкрит.=1,96).
Уравнение значимо в целом 39,39997=F-стат> F-крит. = 2,04 на 1% уровне значимости.
В
Главе 1 отмечалось, что графическое
представление зависимости
| White Heteroskedasticity Test: | |||
| F-statistic | 4.051984 | Probability | 0.000000 |
| Obs*R-squared | 59.91547 | Probability | 0.000004 |
Полученный
результат можно проверить
Результаты
теста говорят о наличии
Учтем
этот факт и проведем поправку Уайта.
Тогда данная модель будет иметь
следующий вид:
| Dependent Variable: SB | ||||
| Method: Least Squares | ||||
| Date: 05/18/08 Time: 19:57 | ||||
| Sample: 1 200 | ||||
| Included observations: 200 | ||||
| White Heteroskedasticity-Consistent Standard Errors & Covariance | ||||
| Variable | Coefficient | Std. Error | t-Statistic | Prob. |
| C | -87356186 | 21211925 | -4.118258 | 0.0001 |
| BUD | 2.305123 | 0.284974 | 8.088898 | 0.0000 |
| ACTOR | 5230277. | 8611834. | 0.607336 | 0.5444 |
| TIME | 6227264. | 1187948. | 5.242036 | 0.0000 |
| MAX | 15546.52 | 6220.358 | 2.499296 | 0.0133 |
| ADV | 46661830 | 28166381 | 1.656650 | 0.0993 |
| PRE | 78523004 | 37039777 | 2.119964 | 0.0353 |
| CAR | 34072723 | 40273335 | 0.846037 | 0.3986 |
| COM | -1998791. | 16154517 | -0.123730 | 0.9017 |
| DIRECTOR | -5188663. | 14648836 | -0.354203 | 0.7236 |
| DRAMA | -4261813. | 13529950 | -0.314991 | 0.7531 |
| FANTA | -43224393 | 24889359 | -1.736662 | 0.0841 |
| FIGHT | -16672298 | 22810062 | -0.730919 | 0.4658 |
| SEASON | -8698813. | 14004858 | -0.621128 | 0.5353 |
| STATE | 2166866. | 14066915 | 0.154040 | 0.8777 |
| THR | 4104583. | 17386786 | 0.236075 | 0.8136 |
| R-squared | 0.762580 | Mean dependent var | 1.29E+08 | |
| Adjusted R-squared | 0.743226 | S.D. dependent var | 1.81E+08 | |
| S.E. of regression | 91604914 | Akaike info criterion | 39.58049 | |
| Sum squared resid | 1.54E+18 | Schwarz criterion | 39.84435 | |
| Log likelihood | -3942.049 | F-statistic | 39.39997 | |
| Durbin-Watson stat | 2.144451 | Prob(F-statistic) | 0.000000 | |