Перейти к содержимому
POST AI agent ready /v1/nationality/estimate

API прогнозирования национальности — оценка страны происхождения по имени

Оценивает наиболее вероятные страны происхождения данного имени с использованием статистических моделей, обученных на глобальных демографических данных. Возвращает массив стран, ранжированных по вероятности с помощью кодов ISO 3166-1 альфа-2. Полезно для локализации, демографического анализа и интернационализации.

Parameters

stringrequired

Name (first or last) to predict nationality for.

Code examples

curl -X POST https://api.botoi.com/v1/nationality/estimate \
  -H "Content-Type: application/json" \
  -d '{"name":"Tanaka"}'

When to use this API

Автоматический выбор локали и языка

Когда новый пользователь регистрируется, указав только свое имя, предскажите его вероятную страну происхождения и установите язык интерфейса и региональные настройки по умолчанию соответственно. Пользователь с именем «Танака» увидит японский в качестве предлагаемого языка, что избавит его от необходимости выбора вручную.

Исследование рынка и анализ аудитории

Проанализируйте национальное распределение вашей базы пользователей или списка адресов электронной почты, пакетно пропуская имена через эту конечную точку. Определите, в каких странах ваш продукт больше всего резонирует, и распределите маркетинговые бюджеты на регионы с наибольшими возможностями.

KYC и предварительная проверка личности

Во время регистрации KYC сравните предполагаемое гражданство с заявленной страной проживания или страной паспорта. Большое несоответствие само по себе не является мошенничеством, но может инициировать дополнительные шаги проверки в вашей модели риска.

Frequently asked questions

Могу ли я использовать имена, фамилии или полные имена?
Конечная точка работает с любым введенным именем. Фамилии (фамилии) часто дают более отличительные сигналы национальности, чем имена. Вы можете передать имя, фамилию или полное имя, хотя ввод с одним токеном (по одному имени за раз), как правило, является наиболее точным.
Что означает показатель вероятности?
Каждая страна в ответе имеет вероятность от 0 до 1, представляющую вероятность того, что человек с таким именем родом из этой страны. Вероятность 0,85 для JP означает, что 85% людей с этим именем в наборе данных родом из Японии.
Сколько стран возвращается?
Ответ включает до 5 стран, ранжированных по вероятности. Включены только страны с немалой вероятностью (выше ~0,01). Имена, тесно связанные с одной страной, могут возвращать меньше результатов.
Почему «Танака» показывает Бразилию как второстепенный матч?
В Бразилии проживает самая большая японская диаспора за пределами Японии. Такие имена, как «Танака», появляются в бразильских записях из-за японской иммиграции в начале 20 века. Модель отражает реальное распределение имен по странам.
Нормализуется ли имя перед обработкой?
Да. Имена пишутся строчными буквами и удаляются из пробелов. Диакритические знаки сохраняются и способствуют предсказанию, поскольку символы с акцентом несут сигналы национальности (например, «Мюллер» против «Мюллер»).

Get your API key

Free tier includes 5 requests per minute with no credit card required. Upgrade for higher limits.