Chaos and Correlation
International Journal, No 8, July 5, 2007

Алгоритмы и законы типизации и идентификации субъектов по астрономическим данным на момент рождения

©Евгений Луценко (Краснодар, Россия)

©Александр Трунев (Торонто, Канада)

©Владимир Шашин (Санкт-Петербург, Россия)

Логотип исследования: в работе изучены 12 частных моделей с разбиением круга зодиака на 3 4 5 6 9 12 15 18 20 24 36 72 секторов. Каждой частной модели соответствует кольцо. Сектора в частных моделях разных цветов спектра, в данном случае используется 16 цветов.

В работах /1-2/ описан математический метод идентификации субъектов по астрономическим данным на момент рождения, который фактически является альтернативой для обычной натальной астрологии. Суть метода заключается в том, что на основе анализа базы данных рождения, категорий и событий жизни множества реальных субъектов, формируется описание категорий и событий, содержащее связи между астрономическими параметрами. Данный подход отличается от обычной астрологии тем, что при распознавании образов используются корреляционные связи, которые выявляются путем многокритериальной типизации респондентов обучающей выборки по исследуемым категориям. При этом на этапе синтеза модели рассчитывается количество информации, которое содержится в фактах попадания долгот углов в интервалы (рассматриваемые как критерии), о принадлежности респондента к тем или иным категориям, а на этапе идентификации эта информация используется для расчета степени сходства конкретных респондентов с обобщенными категориями.   В работах /3,4/ был предложен алгоритм распознавания на 19 сетках различного масштаба для смешанной БД содержащей 500 категорий. В настоящей работе выполнено исследование моделей с целью определения наиболее эффективного алгоритма идентификации и типизации для профессиональной БД содержащей 387 категорий на 12 сетках различного масштаба.

1. Статистические закономерности идентификации

Входные данные задачи представляют собой таблицу, содержащую 20007 записей (строк) независимых респондентов, каждый из которых характеризуется номером записи, именем, полом, датой и временем рождения, местом рождения, собственной биографией и набором категорий и событий жизни. Общее число категорий, определенное для исследуемой БД составляет 1907 (первоначально справочник категорий включал 10988 категорий /2/), а число исследуемых случаев равно 192879, т.е. примерно 9,64 случая на одного респондента. В настоящей работе для повышения достоверности идентификации из списка категорий были отобраны только те из них, которые соотносятся с профессиями. Полученный список профессиональных категорий содержит только 387 наименований (см. Приложение 1), которые представлены в исходной БД с разной частотой встречаемости - рис. 1. Частотное распределение с большой степенью точности описывается экспонентой (распределение Пуассона) - прямая сплошная линия на рис. 1. Суммируя все частоты, находим общее число исследуемых случаев N= 69742. Учитывая, что в исходной БД содержится только 20007 данных независимых респондентов, находим среднее число категорий, приходящихся на одну карту, n=N/20007=3,49. В качестве входных астрономических параметров модели использовались координаты долготы углов 12 домов (в системе Плацидуса), Лунных Узлов и 10 небесных тел – Солнца, Луны, Меркурия, Венеры, Марса, Юпитера, Сатурна, Урана, Нептуна, Плутона. Поскольку модель является дискретной, координаты долготы задавались на 12 сетках различного масштаба с числом секторов разбиения 3, 4, 5, 6, 9, 12, 15, 18, 20, 24, 36, 72 соответственно.

При исследовании частных моделей были установлены некоторые статистические закономерности распознавания, позволяющие повысить эффективность моделей. Во-первых, во всех частных моделях наблюдается обратная зависимость параметра сходства от частоты встречаемости категории: чем выше частота, тем ниже параметр сходства. На рис. 2 представлены результаты распознавания категорий в модели с 72 секторами. В этом случае зависимость параметра сходства от частоты описывается степенной функцией с показателем степени b=-0,5355. Аналогичная зависимость наблюдается и для максимального по всем моделям параметра сходства - рис. 3 (на рисунках 2-3 по горизонтальной оси дана абсолютная частота, т.е. общее число случаев данной категории).

Во-вторых, параметр сходства зависит от числа секторов разбиения - см. таблицу 1А. Все категории можно разбить на три класса в зависимости от величины частоты встречаемости и поведения параметра сходства при изменении числа секторов разбиения. Первый класс составляют категории, для которых параметр сходства убывает с ростом числа секторов разбиения, как это было обнаружено ранее в работах /3,4/. Этот класс категорий характеризуется высокой частотой встречаемости при высоком уровне распознавания, что соответствует данным, лежащим выше линии корреляционной зависимости на рис. 2-3. Некоторые категории этого класса приведены в таблице 1Б вместе с корреляционными зависимостями параметра сходства от числа секторов разбиения. Отметим, что в работах /1-4/ была исследована БД, содержащая 500 категорий преимущественно первого класса. Поэтому была получена обратная зависимость среднего параметра сходства от числа секторов /3,4/. Второй класс составляют категории, для которых параметр сходства возрастает с ростом числа секторов разбиения. Этот класс категорий характеризуется низкой частотой встречаемости и относительно высоким параметром сходства, что соответствует данным, группирующимся вблизи линии корреляционной зависимости на рис. 2-3. Большая часть исследуемой в настоящей работе БД представлена категориями этого класса, поэтому средний параметр сходства возрастает с ростом числа секторов - рис. 4. Отметим, что в современной натальной астрологии используется именно этот класс категорий, поэтому для повышения вероятности распознавания широко применяется анализ на множестве сеток, полученных при разбиении круга Зодиака вплоть до градусов и минут. Третий класс составляют категории, для которых параметр сходства изменяется немонотонно с ростом числа секторов разбиения. Как правило, эти категории имеют среднюю частоту встречаемости и относительно небольшую величину параметра сходства. Общее их число невелико в исследуемой БД, поэтому они не оказывают существенного влияния на поведение среднего параметра распознавания.

Таблица 1Б. Категории первого класса, их абсолютная частота встречаемости и корреляционная зависимость параметра сходства от числа секторов разбиения.

Категории

Частота

Корреляционная зависимость

SC:A53-Sports

4567

y = 75,297x-0,3888 R2 = 0,9747

SC:B111-Sports:Basketball

2385

y = 109,23x-0,5494 R2 = 0,9909

SC:B173-Sports:Football

1613

y = 108,72x-0,3949 R2 = 0,9627

SC:B41-Occult Fields:UFO sighting

502

y = 24,008x-0,3275 R2 = 0,8406

SC:B404-Business:Sex Business

194

y = 45,03x-0,3428 R2 = 0,9783

SC:C78-Famous:Awards:Olympics

162

y = 67,868x-0,3678 R2 = 0,8959

 

 

Насколько представительной является исследуемая БД и какое поколение в ней представлено? Только 2576 карт принадлежат людям, родившимся до 1901 года, остальные родились в 20 веке вплоть до 1998 года включительно. Распределение Солнца, Юпитера и Сатурна по знакам зодиака является достаточно однородным - рис. 5, однако распределение Урана указывает на преобладание карт поколения 1941-1948 (Уран в знаке Близнецов) и 1949-1956 (Уран в знаке Рака).

2. Режимы голосования моделей

Для обработки результатов пакетного распознавания на множестве сеток в работе /3/ был предложен алгоритм, который в данной работе был дополнен еще четырьмя алгоритмами, для выбора наиболее эффективного из них. Таким образом, сравнивались пять алгоритмов, получивших общее название РЕЖИМЫ ГОЛОСОВАНИЯ МОДЕЛЕЙ:

  1. Для нахождения всех категорий, присущих данному респонденту, зададим минимальный уровень сходства, например 20%, составим таблицу распознанных категорий на сетке каждого масштаба с числом секторов разбиения 3, 4, 5, 6, 9, 12, 15, 18, 20, 24 соответственно и отберем те из них, которые повторяются 4 и более раз /3,4/.
  2. Результаты распознавания в частных моделях просто УСРЕДНЯЮТСЯ, т.е. в итоговой карточке идентификации для каждого класса уровень сходства респондента с обобщенным классом является СРЕДНИМ его уровней сходства с этим классом всех частных карточек идентификации.
  3. В итоговую карточку идентификации респондента берется уровень сходства этого респондента с классом из той частной карточки идентификации, в которой он МАКСИМАЛЬНЫЙ (из всех частных карточек).
  4. Когда в итоговую карточку идентификации респондента берется уровень сходства этого респондента с каждым классом из частной карточки идентификации, полученной в той частной модели, которая по результатам измерения достоверности распознавания ДАННОГО КЛАССА показала МАКСИМАЛЬНУЮ достоверность из всех исследованных моделей.
  5. Результаты распознавания в частных моделях УСРЕДНЯЮТСЯ с учетом достоверности идентификации классов в различных частных моделях, например, берется СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.

Сравнение осуществлялось следующим образом. Согласно первому алгоритму выбирался список распознанных категорий, определялось их число, а затем по 4 другим моделям выбирался список с таким же числом категорий, распознанных наилучшим образом по данному алгоритму. В таблице 2 дан пример такого сопоставления.

Таблица 2. Сопоставление категорий, распознанных по 5 алгоритмам.

Модель 1

Модель 2

Модель 3

Модель 4

Модель 5

Категория

Параметр

сходства

Категория

Параметр

сходства

Категория

Параметр

сходства

Категория

Параметр

сходства

Категория

Параметр

сходства

165

10

387

34

298

62

65

52

36

46

387

10

298

31

360

56

68

37

35

40

36

9

360

30

65

52

289

31

212

38

323

9

165

29

220

49

106

31

19

37

357

9

357

27

193

48

377

31

203

36

360

9

323

26

334

48

166

29

298

36

203

8

35

25

165

48

387

28

191

29

298

8

193

24

170

46

44

27

20

23

363

8

170

24

35

46

73

27

323

23

35

7

36

24

323

45

90

27

201

22

170

7

203

22

387

43

170

26

193

20

193

7

363

21

366

41

323

26

185

19

212

7

65

21

201

40

363

25

178

19

258

7

20

20

178

40

273

25

360

18

289

7

258

19

231

40

165

24

387

16

19

6

68

19

271

39

220

24

386

16

20

6

334

18

386

39

308

24

167

15

68

6

373

18

124

39

275

23

315

14

139

6

273

17

330

39

19

23

289

14

191

6

289

17

373

39

298

23

182

13

273

6

212

16

20

38

157

23

65

13

315

6

315

16

68

38

20

23

318

13

373

6

386

16

357

37

72

22

339

13

65

5

220

15

247

37

360

21

37

13

220

5

139

15

312

37

193

21

200

12

263

5

191

15

25

37

191

21

68

12

334

5

19

14

273

37

310

20

286

12

386

5

263

12

327

37

35

20

357

11

44

4

231

12

63

37

36

20

263

10

63

4

106

12

171

36

203

19

139

10

106

4

377

11

216

35

254

19

237

10

115

4

63

11

377

35

386

19

308

9

153

4

153

11

258

35

357

19

165

9

171

4

171

11

166

35

318

19

143

9

231

4

275

11

203

35

315

19

310

9

275

4

343

10

191

34

243

19

287

8

308

4

247

10

153

34

317

18

273

8

343

4

308

10

315

34

368

18

329

8

377

4

366

9

36

34

240

17

220

8

Путем сопоставления номеров категорий можно определить те из них, которые присутствуют во всех пяти моделях. В данном случае это 18 категорий, собранных в таблице 2.

Таблица 2. Категории, опознанные в пяти моделях и упорядоченные по параметру сходства первой модели

Категория

Параметр сходства

165

SC:B781-Law:Police/Security......................................

10

387

SC:E793-Medical:Doctor:Alternative methods:Psychic healer:Hypnoth

10

36

SC:B1330-Sports:Martial Arts.....................................

9

323

SC:C802-Work:Maintenance Field:Cleaning service..................

9

357

SC:D258-Famous:Greatest hits:Art field:Photography field.........

9

360

SC:D376-Business:Sports Business:Coach/ Manager/ Owner:Manager...

9

203

SC:C1257-Education:Teacher:Coach.................................

8

298

SC:C657-Art:Commercial artist:Pro................................

8

35

SC:B1295-Law:Fire department.....................................

7

193

SC:C1151-Education:Teacher:Medicine..............................

7

20

SC:B1040-Work:Self-employed......................................

6

68

SC:B256-Art:Photography..........................................

6

191

SC:C1130-Education:Teacher:Nursing...............................

6

273

SC:C560-Education:Teacher:Astrology..............................

6

315

SC:C760-Art:Fine art artist:Secondary............................

6

65

SC:B246-Financial:Winnings/ Lottery..............................

5

220

SC:C175-Business:Business/Marketing:Public relations.............

5

386

SC:E748-Business:Sex Business:Porno Market:Films:Superstar/star..

5

Поскольку категории в таблице 2 распознаются по всем пяти алгоритмам, все пять алгоритмов можно считать эквивалентными в смысле определения множества категорий из таблицы 2. Различие же алгоритмов может проявиться в установлении приоритетности категорий. Например, категория 165 (SC:B781-Law:Police/Security) распознается по первому алгоритму как наиболее достоверная, по второму алгоритму она оказывается на 4 месте, по третьему - на 7, по 4 - на 15, а по 5 - на 33. С другой стороны, категория 36 (SC:B1330-Sports:Martial Arts), которая распознается по пятому алгоритму с наибольшей достоверностью, также хорошо распознается и по первому алгоритму, но плохо распознается по третьему. Это означает, что каждый из алгоритмов имеет погрешность по отношению к другому, а наиболее эффективным может оказаться алгоритм, являющейся комбинацией указанных выше пяти алгоритмов. Такой комбинацией может быть описанный метод определения пересечения множества категорий, распознанных по каждому алгоритму.

Ссылки

  1. Луценко Е.В., Трунев А.П., Шашин В.Н. ТИПИЗАЦИЯ И ИДЕНТИФИКАЦИЯ РЕСПОНДЕНТОВ В СОЦИОЛОГИИ ПО ИХ АСТРОНОМИЧЕСКИМ ПОКАЗАТЕЛЯМ НА МОМЕНТ РОЖДЕНИЯ/Научный журнал КубГАУ, № 25(1), январь 2007, http://ej.kubagro.ru/2007/01/pdf/14.pdf
  2. Луценко Е.В., Трунев А.П, Шашин В.Н. Типизация и идентификация респондентов, описанных астрономическими показателями на момент рождения по социальным и психофизиологическим категориям с применением АСК анализа. Chaos and Correlation, No 1, November 30, 2006. – Toronto, Canada, – Режим доступа: http://trounev.com/Chaos/No1/AIT59.htm
  3. Луценко Е., Трунев А., Шашин В. Метод пакетного распознавания карт рождения в системе искусственного интеллекта ЭЙДОС. The World Astrology Review, No 10 (58), October 31, 2006, http://trounev.com/thewar/No58/AIT58_1.htm
  4. Lutsenko Eugene, Trounev Alexander, Shashin Vladimir. Method of birth chart recognition by using the artificial intelligence system AIDOS. Chaos and Correlation, No 1, November 30, 2006. – Toronto, Canada, – Режим доступа: http://trounev.com/WordPress/?p=23#more-23