Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Урок 95: Создайте свои независимые и зависимые переменные

Поиск

 

Когда я организую свои базы данных, я обычно помещаю рыночные данные как таковые слева (колонки А, В, С и т.д.); преобразования рыночных данных в независимые переменные я делаю в центре; зависимые переменные я размещаю ближе к правой части. Давайте посмотрим на то, что это означает.

Ваши независимые переменные можно также назвать кандидатами в предикторы (прогностические факторы). Это те показатели, которые, как мы считаем, могут оказывать влияния на рынки, на которых мы торгуем. Например, мы исследуем воздействия изменений цены за предыдущий день (независимая переменная) на процентное изменение индекса S&P 500 (зависимая переменная). Рыночные данные будут состоять из цены индекса S&P 500 за исследуемый период времени. Зависимой переменной станет подсчитанное скользящее изменение цены на следующий день. Независимая переменная представляет собой то, что, как мы считаем, может предоставить нам преимущество в торговле; зависимая переменная – это то, чем мы торгуем, чтобы использовать это преимущество.

 

Если я буду соблюдать порядок организации данных в разных своих таблицах (рыночные данные слева, затем их трансформации в независимые переменные, и затем зависимые переменные), мне будет проще анализировать информацию в разных файлах.

 

Давайте сделаем следующее упражнение. Мы скачаем данные индекса S&P 500 за последние 1000 торговых дней. Мы получим около четырех лет дневных данных. Если я получаю данные у Pinnacle Data, я отрою новый лист в Excel, найду полученный от поставщика файл данных, выделю там ячейки за последние 1000 дневных периодов и скопирую их в Exсel в следующем порядке: дата, открытие, максимум, минимум, закрытие.

Если вы берете данные из другого источника, порядок действий может отличаться, но результат должен быть тем же: ваши данные должны занимать колонки с A по Е. Теперь, назовите колонку F «SP1». Это ваша независимая переменная – процентное изменение индекса в текущем дне. Первое значение вы подсчитаете в ячейке F3 с помощью формулы: =((E3-E2)/E2)*100. Это процентное изменение индекса с закрытия сессии A2 по закрытие сессии A3.

Теперь давайте создадим нашу зависимую переменную в ячейке G7, назвав колонку G «SP+1». Ваша формула в ячейке G3 примет следующий вид: =((E4-E3)/E3)*100. Это представляет собой процентное изменение индекса в каждом следующем дне. Протяните формулы в столбцах F и G до окончания массива ваших рыночных данных. Сохраните файл, он пригодится нам в следующих уроках.

Заметьте, что мы скачали данные за 1,000 дней, но реальное количество значений в нашей выборке составляет 998. Мы не подсчитываем значение SP1 для первой строки рыночных данных, так как у нас нет значения закрытия предыдущего дня; следовательно, нам приходится начинать подсчеты с третьей строки данных. Мы также не можем определить SP+1 для последней строки данных, так как мы не знаем завтрашнюю цену закрытия. Таким образом, в нашем анализе мы можем использовать только 998 значений из 1,000 скачанных. Если вы хотите исследовать ровно 1,000 значений, вам придется скачать как минимум 1,002.

После небольшой практики, все это станет вашей второй натурой. Вы будите тратить всего минуту или две на открытие файлов, копирование данных, и распространение формул на новые строки для обновления переменных. В нашем примере, мы исследуем влияние результата движения рынка предыдущего дня на результат следующего. Мы организуем лист так, чтобы задать вопрос: «Имеет ли смысл покупать после дня роста/продавать после дня падения; имеет ли смысл продавать после дня роста/покупать после дня падения?» Я называю независимую переменную кандидатом в предикторы, по тому что мы еще не знаем, связана ли она с интересующей нас переменной. Также она является кандидатом потому, что мы не проводим проверку статистической значимости, которые могли бы с большей определенностью показать нам влияние предиктора. Вместо этого, мы скорее используем анализ так же, как мы использовали графики в предыдущем уроке: как способ выдвижения гипотезы.

 

Помните, в наших примерах мы используем исторические взаимосвязи, чтобы описать паттерны на рынках, а для их статистического тестирования. Мы генерируем, а не проверяем гипотезы.

 

Если бы меня интересовала взаимосвязь между движением цены рынка на предыдущей неделе и динамикой цены на следующей неделе, мой лист выглядел бы точно так же, но рыночная информация состояла бы из недельных данных, а не из дневных. Как правило, для целей анализа лучше всего исследовать влияние данных предыдущего периода на показатели следующего периода. Этим обеспечивается независимость данных друг от друга, так ваши выборки не пересекаются.

Вот что я имею в виду. Представим исследование влияния движения цены на предыдущей неделе (пять дней) на движение цены следующих пяти дней с использованием дневных данных. Ваша независимая переменная в колонке F будет выглядеть в этом случае так: =((E7-E2)/E2)*100, что отражает изменение цены за последние пять дней. Формула зависимой переменной примет следующий вид: =((E12-E7)/E7)*100 – изменение цены за следующие пять дней. Отметьте, однако, что по мере копирования формул в ячейках вниз (как мы делали это ранее), значения в ячейках F8, F9, F10 и т.д. и G8, G9, G10 и т.д. не являются полностью независимыми. Результат движения цены за предыдущие пять дней пересекается со значениями в ячейках F8, F9, F10, а результат за следующие пять дней со значениями в ячейках G8, G9, G10. Эта проблема будет возникать всегда, если вы используете младшие тайм-фреймы ваших рыночных данных при анализе зависимых и независимых переменных.

При индуктивных статистических исследованиях требуется, чтобы данные были независимыми. По этой причине, неправильно использовать пересекающиеся данные при определении статистической значимости. Для своих целей выдвижения гипотез, я допускаю определенную степень пересечения и могу использовать дневные данные для исследования взаимосвязей между периодами продолжительностью до 20 дней – особенно, если пересечения невелики по отношению к размеру общей выборки. Я не буду исследовать, скажем, 200-дневную динамику с использованием дневных данных и выборкой 1,000 дней. Но у меня не будет подобной проблемы при исследовании, например, влияния изменения цены за прошедшие 5 дней на изменение цены за следующие 5 дней при анализируемом периоде в четыре года.

 

Ваши выводы будут более надежными, если исследуемый период (период, за который вы получаете данные) включает в себя разные рыночные условия: подъемы, спады, диапазоны, высокую волатильность, низкую волатильность и так далее.

 

В целом, мои зависимые переменные будут связаны с будущим движением цены, так как именно оно интересует меня как трейдера. Независимые переменные будут связаны со всем, что (по результатам моих наблюдений) может иметь значение для будущих изменений цены. Обычно, в качестве зависимых переменных я использую движение цены на следующий день (для внутридневных идей) или на следующей неделе (для свинг-гипотез). Если я хочу получить представление о более крупной рыночной картине, я исследую результат движения следующих 20-ти дней. Трейдеры могут использовать различные периоды, подходящие для их любимых тайм-фреймов. Я считаю для себя наиболее полезными периоды от 1 до 20 дней.

Еще раз отмечу, практика приводит к совершенству. Я снова хочу порекомендовать вам сначала научиться скачивать данные и организовывать ваши таблицы, прежде чем пробовать себя в реальных исторических исследованиях. В конце концов, результаты ваших исследований будут настолько же хороши, как те данные, которые вы будете использовать и преобразовывать в ходе анализа.

 

ТРЕНЕРСКИЙ СОВЕТ

Отметьте, как легко вы можете использовать файл, описанный в данном уроке для исследования динамики движения рынков после утренних гэпов. Вашей независимой переменной будет утренний гэп, формула которого будет выглядеть так: =((B3-E2)/E2)*100 – разница в процентах между вчерашним закрытием и сегодняшним открытием. Формула дневного изменения цены будет такова: =((E3-B3)/B3)*100 – разница между сегодняшним закрытием и сегодняшним открытием в процентах. Вам можно будет использовать данные фьючерсов на индексы акций или данные ETF для точного отображения открытия рынка; значения индексов не отражают правильные значения на открытии, так как не все акции торгуются уже в первые минуты сессии.

 


 



Поделиться:


Последнее изменение этой страницы: 2016-08-06; просмотров: 289; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.137.162.107 (0.008 с.)