API прогнозирования национальности — оценка страны происхождения по имени
Оценивает наиболее вероятные страны происхождения данного имени с использованием статистических моделей, обученных на глобальных демографических данных. Возвращает массив стран, ранжированных по вероятности с помощью кодов ISO 3166-1 альфа-2. Полезно для локализации, демографического анализа и интернационализации.
Когда новый пользователь регистрируется, указав только свое имя, предскажите его вероятную страну происхождения и установите язык интерфейса и региональные настройки по умолчанию соответственно. Пользователь с именем «Танака» увидит японский в качестве предлагаемого языка, что избавит его от необходимости выбора вручную.
Исследование рынка и анализ аудитории
Проанализируйте национальное распределение вашей базы пользователей или списка адресов электронной почты, пакетно пропуская имена через эту конечную точку. Определите, в каких странах ваш продукт больше всего резонирует, и распределите маркетинговые бюджеты на регионы с наибольшими возможностями.
KYC и предварительная проверка личности
Во время регистрации KYC сравните предполагаемое гражданство с заявленной страной проживания или страной паспорта. Большое несоответствие само по себе не является мошенничеством, но может инициировать дополнительные шаги проверки в вашей модели риска.
Frequently asked questions
Могу ли я использовать имена, фамилии или полные имена?
Конечная точка работает с любым введенным именем. Фамилии (фамилии) часто дают более отличительные сигналы национальности, чем имена. Вы можете передать имя, фамилию или полное имя, хотя ввод с одним токеном (по одному имени за раз), как правило, является наиболее точным.
Что означает показатель вероятности?
Каждая страна в ответе имеет вероятность от 0 до 1, представляющую вероятность того, что человек с таким именем родом из этой страны. Вероятность 0,85 для JP означает, что 85% людей с этим именем в наборе данных родом из Японии.
Сколько стран возвращается?
Ответ включает до 5 стран, ранжированных по вероятности. Включены только страны с немалой вероятностью (выше ~0,01). Имена, тесно связанные с одной страной, могут возвращать меньше результатов.
Почему «Танака» показывает Бразилию как второстепенный матч?
В Бразилии проживает самая большая японская диаспора за пределами Японии. Такие имена, как «Танака», появляются в бразильских записях из-за японской иммиграции в начале 20 века. Модель отражает реальное распределение имен по странам.
Нормализуется ли имя перед обработкой?
Да. Имена пишутся строчными буквами и удаляются из пробелов. Диакритические знаки сохраняются и способствуют предсказанию, поскольку символы с акцентом несут сигналы национальности (например, «Мюллер» против «Мюллер»).
Get your API key
Free tier includes 5 requests per minute with no credit card required. Upgrade for higher limits.