Zakaj bo Kitajska zmagala v bitki glede umetne inteligence

Zelo preprost odgovor na to vprašanje je: Ker so KItajci naredili odprtokodni sistem za razvoj UI in ker so bolj odprti do aplikacij UI, zato bodo te aplikacije bolj široko vpeljali in uporabili. Arnaud Bertrand je bil v spodnjem komentarju članka v Financial Timesu glede tega zelo plastičen: iznajdba parnega stroja sama po sebi ni bila nič posebnega, kar jo je naredilo pomembno, je aplikacija parnega stroja v industriji in transportu, kar je povzročilo industrijsko revolucijo in omogočilo Britaniji, da se je gospodarsko izjemno razvila in pridobila prednost pred vsemi ostalimi.

This is rare enough to be highlighted: an actually good Financial Times article on the state of the AI “race” between the U.S. and China.

Three interesting points that stood out to me:

1) The fact that “for a general-purpose technology such as AI, long-term advantage often comes down to how widely and deeply technologies spread across society.”

This is because, at the risk of pointing the obvious, benefits from a new technology come from using it widely, not just creating it. You wouldn’t get any benefit from discovering the steam engine in and of itself: what drove productivity gains (and ultimately Britain’s advantage in the industrial revolution) was spreading and using this technology in its society.

And China has advantages here, as the article notes, since they’re unarguably better at orchestrating society-wide transformation, as that’s all they’ve been doing for the past 3 decades.

2) The point that US semiconductors export controls actually helped China in AI since they “pushed Chinese companies towards a different playbook: pooling compute, optimising efficiency and releasing open-weight models.”

This is extremely ironic as the US effectively pushed China to develop models that are a) more efficient (since operating under constrains the U.S. doesn’t have) and b) open-source (since China has constrained compute).

Which turns out to be the better strategy for global diffusion: if you’re a company in say Germany or Brazil, you can download Qwen or Deepseek, run it locally, fine-tune it for your market, and never worry about API rate limits (and worry less about costs since the models are more efficient and you don’t have an AI unicorn taking a cut every time you run a query).

3) The oft-ignored point of societal enthusiasm. As the article notes: “The public in China [is] the most optimistic in the world about AI — far more than in the US or the UK… Optimism can be a powerful fuel”

I often lament about this as a European: we often have a doomist take on new technologies (AI very much included), which is a huge repellent for entrepreneurship and technological diffusion. And that ultimately hurts Europe a lot in many ways, precisely because of the first point above: advantages from new technologies come down to how widely and deeply it spreads in society.

If China is the most enthusiastic country in the world about AI, this in and of itself will help drive the widespread adoption that, per point 1, is what actually matters for long-term competitive advantage.

En odgovor

  1. Kdo bo v tej zmešnjavi zmagal, se pač  ne ve do samega konca. Eno pa je jasno: ameriška AI je narejena v korist lastnikov korporacij, ki razvijajo AI. V končni fazi morajo vse koristi  od AI pobrati oni, in nihča drug. Na vseh možnih tehnoloških, ekonomskih in političnih področjih.  Za ta namen so si zagotovo vzpostavili nadzorne sisteme, da AI ne bi »zbezljala« v napačno smer. A kdo morebiti misli, da bo končna korist od AI šla v roke  države USA, ali pa morebiti »American people«? Ne! Vse usmeritve AI, kje iskati rešitve in v katero smer obrniti koristi od uporabe AI, so v temelju vtkane v ameriške AI aplikacije. Čeprav zmore AI pojasniti ravno obratno, da dela vse v korist (vseh) ljudi, ameriške družbe  kot celote. Gotovo pa  je, da rešitve išče le v povečanju koristi za lastnike AI korporacij. Kaj drugega si ni niti za misliti.

    V kateri smeri išče rešitve problemov kitajska AI, seveda ni jasno, ker ne poznamo tamkajšnjih okoliščin: kdo želii imeti korist od  njihove AI.

    Všeč mi je

  2. Hm. Po tej logiki bo v tej dirki zmagal Evropa z Mistralom, ali pa morda kar Zuckerberg.

    V poduk bralcem (in avtorju, če prebira komentarje) razlika med open weight in open source modeli ter seznam nekaj taglavnih (kitajskih NI med open source).

    1) Closed-source (zaprti modeli)

    • GPT-4 / GPT-5 (OpenAI)
    • Claude 3 (Anthropic)
    • Gemini Ultra (Google)

    Ti modeli so dostopni samo prek API, brez dostopa do uteži.
    Vir: OpenAI in Anthropic dokumentacija javno navajata, da modeli niso distribuirani kot parametri, ampak le kot storitev (npr. https://platform.openai.com/docs/).

    2) Open-source modeli (odprta koda in odprte uteži brez omejitev OSI)

    • OLMo (Allen Institute for AI, Apache 2.0)
    • GPT-NeoX in GPT-J (EleutherAI, MIT licenca)

    Res odprti po standardu Open Source Definition (OSI), kjer morajo biti dovoljena uporaba, spreminjanje in ponovna distribucija.
    Vir: https://opensource.org/osd

    3) Open-weight modeli (uteži so prosto dostopne, licenca pa pogosto omejuje rabo)

    • LLaMA 2 in 3 (Meta, licenca omejuje komercialno rabo v določenih primerih)
    • Mistral 7B / Mixtral (Mistral AI, MPL-2.0, dovoljena komercialna raba pod določenimi pogoji)
    • Qwen (Alibaba, komercialno dovoljena, a s pogoji)
    • Yi (01.AI, odprte uteži, komercialno dovoljeno po pogojih)
    • DeepSeek (DeepSeek AI, kitajski modeli optimizirani za učinkovitost, uteži objavljene v različnih licenčnih režimih)
    • Baichuan 2 (Baichuan Inc., odprte uteži z neenotnimi pogoji za komercialno rabo)

    Open-weight pomeni: model lahko poganjaš lokalno, vendar pravice niso povsem odprte.
    Vir: Meta LLaMA License 1.0 jasno določa komercialne omejitve za podjetja nad določenim prihodkovnim pragom. Zelo kratek povzetek razlike (komentar za blog):

    • Zaprti modeli = uporabljaš jih prek API, nič ni javno.
    • Odprti modeli = koda + uteži + dovoljena prosta uporaba po OSI standardu.
    • Open-weight modeli = uteži so na voljo, a licenca pogosto omejuje komercialno ali določene načine uporabe.

    Všeč mi je