Как дешёвый труд помогает амбициям Китая в области искусственного интеллекта


Работники в штаб-квартире Ruijin Technology Company в Цзясяне, находящемся в центральной провинции Китая, Хэнань. Они распознают объекты на изображениях, помогая ИИ ориентироваться в реальном мире.

Работа, которую можно считать одной из важнейших для приближения к целям, стоящим перед китайскими технологиями, происходит на бывшем цементном заводе, посреди центральной провинции Китая, далеко от местных кремниевых долин, находящихся в Пекине и Шэньчжэне. Посреди двора стоит замершая бетономешалка. Соседний склад заполняют коробки с пластмассовой посудой.

А внутри завода Хоу Сямэн управляет компанией, помогающей ИИ разобраться в реальном мире. Пара десятков молодых людей просеивают фото и видеоролики, отмечая всё, что они видят. Это автомобиль. Это светофор. Это хлеб, это молоко, это шоколад. Вот так выглядит идущий человек.

“Раньше я думал, что машины гениальны, – говорит Хоу, которому исполнилось 24. – Сейчас я знаю, что причина их гениальности – это мы”.

В Китае, долго служившим производственной фабрикой для всего мира, новое поколение малооплачиваемых сотрудников строит фундамент будущего. В небольших городах с более дешёвой жизнью появляются стартапы, занимающиеся простановкой меток для огромной коллекции изображений и записей с камер наблюдения. Один эксперт назвал Китай Саудовской Аравией данных – значит, эти предприятия можно назвать нефтеперегонными, превращающими сырые данные в топливо, способное питать амбиции Китая в отношении ИИ.

Здравый смысл говорит, что Китай и США соревнуются за превосходство в области ИИ, и что у Китая есть определённые преимущества. Китайское правительство оказывает всестороннюю поддержку компаниям, занимающимся ИИ, как финансовую, так и политическую. Китайские стартапы занимали треть мирового рынка компьютерного зрения в 2017 году, обогнав США. Китайские научные работы чаще цитируют. В ключевом анонсе, сделанном в прошлом году, китайское правительство сообщило, что ожидает от своей страны первого места в области ИИ к 2030 году.

Наиболее важным считается тот факт, что китайское правительство и компании имеют лёгкий доступ к горам данных благодаря слабости законов, относящихся к частной жизни. Китайские интернет-компании могут получать больше данных, чем Facebook, Google и Amazon, поскольку тамошние жители активно используют телефоны для совершения покупок, оплаты ресторанов и покупки билетов.


Хоу Сямэн управляет фабрикой данных, расположившейся на бывшем цементном заводе, принадлежавшем родителям её мужа в городе Наньгунши провинции Хэбей.

Однако многие из этих заявлений сомнительны. Доверять китайским газетам и патентам не стоит. Деньги правительства могут быть растрачены. Неизвестно, будет ли гонка за ИИ игрой с нулевой суммой, в которой победитель получает всё. Данные бесполезны, если их некому разобрать и каталогизировать.

Но истинной силой Китая в области ИИ может стать возможность разметить эти данные – и это может быть единственной силой, которой США будет нечего противопоставить. Эта новая китайская индустрия предлагает способ заглянуть в будущее, давно обещанное правительством: это будет экономика, построенная не на производстве, а на технологиях.

“Мы – строители цифрового мира. Наша работа – выкладывать кирпич за кирпичом, – сказал И Якэ, сооснователь фабрики разметки данных в Цзясяне, городе, находящемся в центральной провинции Китая, Хэнань. – Но мы играем важную роль в развитии ИИ. Без нас никто не построит небоскрёбы”.

Хотя ИИ обучаются очень быстро и хорошо справляются со сложными вычислениями, им недостаёт когнитивных возможностей, которыми может похвастаться средний пятилетний ребёнок. Маленькие дети знают, что мохнатый коричневый кокер-спаниель и чёрный немецкий дог – это собаки. Они могут отличить пикап Ford от Жука Volkswagen, понимая, что это – машины.

ИИ необходимо обучать. Ему приходится переваривать огромное количество размеченных фотографий и видеороликов, пока он не поймёт, что чёрная кошка и белая кошка – это всё кошки. Здесь и начинается работа фабрик данных и их рабочих.

Размечающие материалы работники помогли AInnovation, пекинской компании, исправить их автоматическую систему оплаты, использующуюся в китайской сети пекарен. Пользователям предлагается поместить сладость под сканер и заплатить за неё, не обращаясь к помощи живых кассиров. Но примерно в трети случаев система не справлялась с тем, чтобы отличить кексы от пончиков или дим-самов со свининой – распознавание усложняли освещение в магазине и движения людей. Работая с фотографиями, сделанными в магазине, разметчики добились 99% точности, сказал Лян Жуй, менеджер проекта в AInnovation.

“Весь искусственный интеллект построен на человеческом труде”, – сказал Жуй.

В AInnovation работает менее 30 разметчиков, но быстрый рост количества стартапов, занимающихся разметкой, позволил отдать эту работу сторонним компаниям. Однажды Жую потребовалось разметить 20 000 фотографий, сделанных в супермаркете, за три дня. Коллеги при помощи фабрик данных справились с этим всего за пару тысяч долларов.


Компания по обработке данных Yunzhi в Наньгунши. Основатель компании Хоу говорит, что она не тратит время на раздумья по поводу последствий их работы. “Пока что мы контролируем машины”.


Офис компании Yunzhi. Это типичный стартап из небольшого и недорого города – такие компании начали массово появляться в Китае. Они занимаются разметкой огромной коллекции фотографий и записей с камер видеонаблюдения.

“Мы похожи на конвейерные линии десятилетней давности”, – сказал И, сооснователь фабрики данных в Хэнане.

Яндекс.Еда: скидка 25% при первом заказе на сумму от 700 рублей, промокод AGHGYY

Оплатите подписку, и реклама отключится

Фабрики данных возникают вдалеке от крупных городов, в достаточно удалённых местах, где можно недорого найти офисы и рабочую силу. Многие из работников этих фабрик когда-то работали на сборочных линиях и стройках в тех самых больших городах. Но количество рабочих мест снижается, рост зарплат замедляется, и многие китайцы предпочитают жить поближе к родным местам.

36-летний И лишился работы и пытался заработать денег вместе со своими одноклассниками, когда кто-то упомянул разметку для ИИ. Поискав в интернете, он решил, что это дело не особенно сложное технически, но требует дешёвой рабочей силы, чего в Хэнане было полно.

В марте И с друзьями основали компанию Ruijin Technology, снимающую офисы общей площадью в пару баскетбольных площадок в индустриальном парке за $21 000 в год. Раньше здесь проводились мероприятия для Коммунистической партии, поэтому потолочные светильники украшены серпами и молотами.

В Ruijin, что значит “умное золото”, сейчас работает 300 человек, но они планируют расширяться до 1000 после китайского Нового года, когда множество мигрантов возвращается домой.

В отличие от других работников и бизнесменов по всему миру, И не беспокоится по поводу того, что ИИ отнимет у него работу. “Машины пока недостаточно умны, чтобы обучаться самостоятельно”, – сказал он. Стоит больше беспокоиться о найме новых сотрудников.

В компании платят $400-$500 в месяц, что больше, чем в среднем в Цзясяне. Некоторые из потенциальных работников беспокоятся по поводу того, что они ничего не знают об ИИ. Другим работа кажется скучной.

19-летний Цзинь Вэйсян сказал, что уволится из Ruijin после китайского Нового года и пойдёт продавать мебель в реальном магазине на юге Гуанчжоу.


“Мы – строители цифрового мира. Наша работа – выкладывать кирпич за кирпичом, – сказал И Якэ, сооснователь Ruijin Technology

“Я люблю общаться с людьми, – сказал Вэйсян. – А сейчас ставлю метки за деньги”. Но бывшим рабочим-мигрантам здесь работать нравится больше, чем на сборочных конвейерах. “Та работа была одной и той же, те же самые движения повторялись ежедневно”, – сказал И Чжэньчжэнь, 28-летний работник Ruijin, когда-то трудившийся в фирме, производящей электронику. “А теперь мне приходится немного работать головой”.

Большую часть времени клиенты фабрик данных не сообщают им конечной цели заданий. Некоторые могут быть очевидными. Разметку светофоров, дорожных знаков и пешеходов обычно делают для робомобилей. Разметка множества различных цветков камелии подходит для поисковых систем.

Однажды Ruijin поставили задачу разметить изображения миллионов человеческих ртов. И сказал, что не уверен в конечной цели задания. Может, распознавание лиц?

Примерно в 500 км к северу, в городе Наньгунши провинции Хэбей, Хоу Сямэн управляет фабрикой данных, расположившейся на бывшем цементном заводе, принадлежавшем родителям её мужа. На своей первой работе по окончанию колледжа она занималась разметкой лиц для компании Megvii, предлагающей услуги по распознаванию лиц, с капитализацией в $2 млрд, и наиболее известной своей технологической платформой Face++. По сей день некоторые системы распознавания лиц распознают её раньше её друзей, поскольку, как она говорит, “моё лицо хранится в первой базе данных”.

Но жизнь в Пекине была сложной и дорогой. Она и Чжао Ячэн, который был тогда её женихом, решили вернуться в родной город и открыть фабрику данных. Родители Хоу оплатили покупку столов и компьютеров. Сейчас они ремонтируют соседний склад, чтобы нанять ещё 80 человек.

Как и И, Хоу не тратит время на раздумья по поводу последствий их работы. Помогают ли они развитию государственной слежки и появлению антиутопического будущего, в котором машины будут контролировать людей? “Камеры позволяют мне чувствовать себя в безопасности, – сказала она. – Пока что мы контролируем машины”.

Источник

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

1,699 просмотров всего, 2 просмотров сегодня