Uncategorized

Siri așteaptă întrebarea.

Siri așteaptă întrebarea. (Siri - asistent virtual cu Inteligență Artificială)

La conferința ICEEFEST 2018 am asistat la un panel despre politică, internet, revolte și AI. La întrebarea mea paneliștilor “Cum arată sfârșitul democrației în contextul tematicii panelului” ei au arătat nedumeriți, să nu spunem că m-au considerat un țâcnit.

Mai jos voi încerca să răspund ce am avut eu în vedere. Stați cu mine.

Rezultatul electoral depinde în mare măsură de faptul cum candidații sunt arătați de mass-media. Odată cu popularizarea Internetului și a rețelelor de socializare tot mai mulți politicieni recurg la dialogul cu electoratul prin Internet. Pentru cei sceptici, în anul 2019 timpul petrecut în Internet va întrece timpul petrecut în fața TV-ului. Adică consumul neliniar de informație va întrece consumul liniar și centralizat (Radio/TV). De ziare nu mai vorbim, ele sunt duse.

Însă în epoca Internetului există o mare problemă cu informația, ea este mult prea multă. La început au fost multe search-uri care au dat faliment după ce a apărut google cu un nou algoritm de aranjare a informației (PageRank) și care practic a acaparat tot Internetul. Mai târziu Google a introdus un nou sistem, BrainRank. Atunci când cauți ceva informație pe o anumită temă, AI (Inteligența Artificială) decide ce rezultate vei vedea.

Pe de altă parte, Facebook-ul vine cu o altă invenție destul de revoluționară, News Feed. Unde informația curge spre tine, nu tu o cauți. Însă acest șir informațional la fel este generat în dependență de preferințele tale, prietenii tăi, timp și multe alte semnale care Facebook-ul alimentează EdgeRank-ul lor pentru a scoate ceva relevant pentru ochii tăi în timp ce tu faci scroll de pe mobil. Deci și aici șirul informațional va depinde sau deja depinde de AI pentru că Facebook investește resurse considerabile în acest domeniu.

Similar e și la Twitter, Youtube, Netflix... și alte servicii unde abundă informația, iar tehnologiile de growth hacking încearcă să te facă să revii și să revii pentru că îți arată doar ceea ce dorești.

Marea majoritate din noi având dispozitive mobile transmitem cantități enorme de date la companiile care produc telefoane sau aplicații. Acestea la rândul lor ne servesc informațiile care nouă ne plac.

Viralitatea revoltelor mult lăudate din Chișinău și #rezist din București este dependentă de diciziile AI-ului. AI decide cât de viral poate fi un eveniment sau grup, sau o postare; în dependență de numărul de like-uri, share-uri, comentarii, locație, timp… La un eveniment care a avut succes posibil sunt sute de evenimente la care organizatorii nu au reușit să adune lume. De ce? Pentru că creierul artificial a decis că nu se merită de promovat în news feed-ul oamenilor.

Facebook are atât de multe date despre fiecare din noi că își permite să genereze liste de oameni în baza unei alte liste de oameni (Lookalike). De exemplu, dacă vrei să-ți mărești numărul membrilor în partid, îi dai Facebook-ului lista tuturor membrilor de partid care au cont în Facebook și el îți face o altă listă de oameni care au viziuni similare, însă încă nu sunt membri de partid. Îți rămâne să plasezi un îndemn și să îi chemi în partid.

Scandalul Cambridge Analytica i-a făcut pe congresmeni să înțeleagă puterea unui sistem cu inteligență artificială și cum el poate influența alegerile. Alegeri care până mai ieri se făceau de pe ecranele TV-ului.

Deci sistemele bazate pe AI deja controlează fluxul informațional și totodată știu foarte mult despre comportamentul nostru.

În viitorul apropiat când majoritatea populației va fi în Internet (în unele țăre majoritatea deja este în Internet) partidele politice pot adopta o altă tactică, cea de simulare a candidatului cu cea mai mare probabilitate de câștig în dependență de preferințele electoratului. Vor lupta în a găsi candidatul, nu în promovarea lui. De aceea în viitor mult va conta brandul personal. La alegerile parlamentare lista candidaților se va face în dependență de simulările membrilor de partid care au cele mai mari șanse de câștig a electoratului. Sau se va încerca diversificarea listei. De exemplu, un candidat este popular printre bucătari, altul printre ingineri, al treilea pe instagram….

Democrația devine broasca care încetul cu încetul se fierbe în apă și nu-și dă seama că moare. Vom avea iluzia că am găsit candidatul cel mai bun însă cine este acest candidat îl va decide inteligența artificială.

În final vom ajunge să întrebăm de Siri pe cine să votăm.

Există vreo soluție pentru a evita această dependență de AI? Dacă aveți și voi una sunteți bineveniți să o lăsați în comentarii.

Eu am una. Vă aștept să o citiți în articolul viitor.

bell curve

Când fac un sondaj, organizatorii încearcă să aleagă eșantionul cât mai reprezentativ pentru ca sondajul să fie cât mai corect.  După ce se colectează un număr relativ mare de respondeți, se declară marja de eroare și se anunță în presă rezultatele sondajului. Atenție însă, marja de eroare este de fapt o eroare tehnică (adică câte % din oameni au greșit indicațiile). Aceasta nu e o eroare de la purul adevăr care sondajul trebuie să-l găsească. Recomandarea mea este ca această eroare să nu fie inclusă în slide-uri pentru a nu induce în eroare jurnaliștii.

Părerea mea subiectivă este că toate sondajele realizate până acum sunt făcute greșit. Vă explic și de ce.

Problema este în alegerea eșantionului reprezentativ.

Noi, oamenii, când încercăm să facem eșantionul ne străduim să inventăm câteva categorii de persoane, apoi vedem care este distribuția lor în societate și repectiv extrapolăm în eșantion.

De exemplu: Eșantionul e de 1000, iar studenți în țară sunt 5% înseamnă că în eșantion trebuie să avem exact 50 studenți, nici mai mult nici mai puțin.

Aceste categorii în domeniul Machine Learning se mai numesc features.  Noi, oamenii, încercăm să gândim ce categorii de oameni poate să voteze diferit de o altă categorie și să le includem în sondaj pe ambele; Machine Learning ia în vedere orice bifă care indică fiecare om și încearcă să și calculeze care anume din aceste bife influențează deciziile omului.

Extragerea features sau embed-urilor nu este o noutate în domeniul deep learning. Mai țineți minte cum Google Translate și-a inventat propriul limbaj de comunicare? Sau cum diacritice.ai plasează corect diacritice fără să știe măcar regulele limbii române?

Deci cum ar trebui să arate un sondaj făcut corect?

  1. Trebuie să colectăm cât mai multă informație despre persoanele care au votat în trecut și cum au votat ei.
  2. Crearea unor embed-uri în baza acestor date.
  3. Crearea unui sondaj și colectarea a cât mai multor respondenți.
  4. Eliminarea repondenților care nu sunt relevanți conform proporției de embeduri.
  5. Publicarea datelor statistice de la respondenții rămași.

Știu, veți spune că niciodată nimeni nu va declara cu cine a votat și cu atât mai mult o mulțime de bife care indică totul despre el. Sunt de acord cu voi.

Ne rămâne până atunci să ne jucăm de-a pseudo-sondajele.

"Bots are the new apps." Microsoft CEO Satya Nadella

Acum câțiva ani m-am lăsat de făcut aplicații pentru dispozitive mobile din simplul motiv că acest segment a devenit supraaglomerat.

Cu un cost per install de la $0.35 până la $3.35 pentru o aplicație care o dădea-i gratuită era destul de greu să-ți întorci banii în 3 luni (statistic un utilizator ține instalată o aplicație la el în dispozitivul mobil).

Cu timpul, oamenii au început a păstra aplicațiile rețelelor sociale și chat-urile. Deși unele rețele sociale permit să faci aplicații pentru ele, de obicei sunt doar pentru desktop. Însă în chat-uri integrarea e universală și este mult mai simplă. Prin boți!

Ce este un bot?

E o aplicație care rulează undeva pe un server și nu are o interacțiune directă cu utilizatorul. Comunică doar cu serverele sistemului de chat. Botul nu se instalează, trebuie doar să începi să comunici cu un anumit @nickname din acel sistem de comunicare.

Sistemele de comunicare, skype, facebook messange, kik, telegram… toate au metode de interacțiune cu boți și practic iau asupra lor toată comunicarea cu oamenii.  Rămâne doar să primiți mesajele, să le procesați și să dați un răspuns.

Începând cu anul trecut s-a început o bătălie între companiile mari pentru crearea de platforme pentru boți. Iată câteva: Microsoft cu luis.ai, IBM cu Watson, Amazon cu Lex, Google cu api.ai, Facebook cu wit.ai, Apple cu SiriKit.

Pe șleau spun, aceste platforme nu sunt așa de inteligente precum declară ei pe site.  Practic totul să reduce la crearea de către programator a unei liste de Intent-uri și Entities. Apoi, sistemul inteligent să poată din textul pe care îl scrie omul să aleagă un intent deja definit de programator, să separe o entitate și să dea răspunsul corespunzător.

O altă formă de comunicare este restricționarea răspunsurilor, unde persoana poate culege doar unele cuvinte sau apăsa unele butoane direct în chat.

O problemă și mai mare este că ele lucrează doar cu engleza sau cu limbile de circulație largă. Nu și cu româna. :(

Nu v-ați plictisit? Vă invit să citiți cum am construit bot-ul pentru privesc.eu care comunică în română și răspunde la orice întrebare despre serviciile privesc.eu.

După o lungă cercetare a platformelor de boți am dat peste http://dev.botframework.com/  . O platformă care combină orice chat cu orice platformă de inteligență artificială. Practic face toată munca de integrare a botului care îl faci cu mai toate sistemele de comunicare populare: SMS, Email, Skype, Telegram, Facebook Messanger, Slack…. Îți rămâne să faci logica și să apelezi după caz prin REST la alte servicii de procesare a informației textual cum ar fi: LUIS, Wit.AI, Watson, Lex…

Bot framework integration

Pentru a răspunde la întrebările frecvente la privesc.eu am apelat la serviciul https://qnamaker.ai de la Microsoft. Face un lucru simplu. Îi dai paginile cu FAQ-uri pentru a-și construi cu baza de date,  încearcă să înțeleagă ce întrebare îi adresează omul și caută răspunsul corect din lista de răspunsuri. Nu-ți generează el un răspuns, doar îți returnează cel mai probabil răspuns conform întrebării adresate.

După cum și am spus mai sus, aceste sisteme lucrează doar cu limba engleză. Am tradus în engleză cele 3 pagini de FAQ de pe privesc.eu și le-am dat la procesare. Am mai adăugat și unele întrebări care nu erau în FAQ. Am dat Train & Publish. Buh.. Gata de utilizare.

Codul acestui bot e destul de simplu și practic se reduce la chemarea altor servicii de procesare a informației.

Mesanger Controller

Prin REST, facem un apel la acest serviciu cu întrebarea în engleză și el ne întoarce în engleză răspunsul corect.

Deh.. moldovenii noștri nu prea știu engleza. Pentru a rezolva problema am utilizat https://cloud.google.com/translate/docs/. Traduce întrebarea din română în engleză, apoi întreb de qnamaker și apoi traduc răspunsul în română. Done.

Code for bot Privesc.Eu

Acest bot e destul de prostuț, nu prea înțelege întrebările. Doar 30 de întrebări-răspunsuri am în baza de date. Rezolvarea e simplă, vă rog pe voi să întrebați orice, botul îți va răspunde aiureli însă eu voi urmări logurile și voi adăuga răspunsurile.

Din botframework îmi rămâne să conectez cu sistemele de comunicare dorite, se face foarte simplu. De obicei se reduce la preluarea unor key-uri din sistemele de chat și salvarea lor în botframework.

Vă invit la o degustare testare.

1 Comment

Puișori
M-am întâlnit cu mulți politicieni care auzind de Silicon Valley, doresc să replice acest model la noi în țară. Pentru a evita populismul din partea lor, am identificat o serie de probleme și provocări care împiedică dezvoltarea ecositemului de startup-uri la noi.

  1. Startup-urile IT, e adevărat, pot fi lansate cu bani puțini. Un SRL se deschide ușor, însă e foarte greu să-l închizi. Doar 5% din startup-uri au succes, restul mor. E important să-ți închizi ușor afacerea.
  2. Pentru ca ulterior să poți atrage investiții, să dai cote părți și drepturi de vot, e nevoie să fie creată o companie de tip Corporate. Legislația învechită nu prea permite acest lucru.
  3. Legislația muncii din Moldova și Europa prea mult favorizează angajații, astfel ecosistemul de startup-uri practic nu există în această regiune. Antreprenorii au frică să angajeze.
  4. Sistemul de impozitare de tip TVA, fac toate startup-urile locale necompetitive cu cele americane.
  5. Dacă ai o companie care lucrează pe piața internațională trebuie să ții conturile bancare în valută, însă statul îți mai taxează odată conturilor în valută ca și profit, atunci când crește cursul leului. E adevărat că dacă scade cursul se dă la pierderii. Problema e că leul nu scade.
  6. Lipsa juriștilor cu cunoștințe în IT. (Chiar am asistat la o judecată unde 2 avocați și un judecător vorbeau aiureli în domeniul IT).
  7. Lipsa Angel Investors care să investească în startup-uri. Aceștia de regulă sunt persoanele care fac parte din foarte multe board-uri și contribuie la dezvoltarea noului startup prin intermediul relațiilor pe care le au.
  8. Antreprenori care nu au cunoștințele necesare pentru a înțelege cum lucrează investițiile. Le tratează ca pe împrumuturi bancare.
  9. Investitori puțini și cu gândire sovietică, atunci când îți dau bani, iar înapoi cer 51% din companie.
  10. Accesul la procesoarele de carduri internaționale practic inexistent (bine că Paypal a venit), astfel e foarte greu să-ți construiești o afacere digitală internațională cu sistemul de plăți local rudimentar.
  11. Lipsa acceleratoarelor.
  12. Suntem o națiune care nu știe să vândă. (spre deosebire de SUA sau Israel)

Rezultatul este:

  1. Companii de IT care au afaceri cu statul, având ca proprietari funcționari sau birocrați. Aceste companii de obicei fiind folosite la furtul banilor din buzunarul cetățenilor.
  2. Deși se vehiculează că 10% din PIB este generat de către ITC, în realitate doar 2% sunt generate de IT și 8% de comunicații (Orange, Moldcell, Moldtelecom).
  3. Marea majoritate a companiilor de IT sunt de tip outsource, adică primesc banii din afară doar atât cât să plătească salariile și taxele aferente.
  4. Chiar dacă se fac o mulțime de evenimente pentru crearea startup-urilor, de obicei vin aceiași concurenți. Iar după eveniment noua echipa de regulă se desființează.

PS: Doar cu Internet de calitate superioară nu poți face un startup.

Mining Rig

4x HD Radeon 7950 Cards mining rig


În secolul 13, Leonardo di Pisa, știut sub nickname-ul Fibonacci, unul dintre cei mai talentați matematicieni din istoria omenirii, a fost în Africa de Nord unde a învățat despre matematica arabă. Când s-a întors în Italia a scris o carte “Liber Abaci” unde a arătat beneficiile sistemului Hindu-Arabic de numerație. Pe acele timpuri se utiliza sistemul Roman de numerație.

Păi iată, noul sistem de numerație arabic, din cauza rivalității dintre biserica creștină și musulmani, a fost interzis de către autorități. Au fost invocate multe motive: ce se va întâmpla dacă toată prostimea va reuși să învețe a număra, că cifrele pot fi ușor modificate și pot fi manipulate cifrele contabile…. Cine utiliza sistemul de numerație era considerat criminal!

A luat tocmai 200 de ani ca Europa să înțeleagă avantajul noului sistem de numerație.

Am impresia că acum am revenit în Evul mediu. A apărut un nou mediu de comunicare - Internetul și tututor le-a întunecat mintea. Cele mai mari crime au apărut aici. Iar cei care fac legile aberează cum pot: percheziții informatice, spionare de trafic, protecția dreptului de autor, plasare de linkuri "piratate".

Mai nou, rușii vor să bage la pușcărie pe cei care produc bitcoini. Adică pentru faptul că rezolvă o puzzle matematic (SHA256) și sunt răsplătiți cu un număr să stea la pușcărie 7 ani.

Să o ținem tot așa, să mai batem pasul pe loc încă măcar o sută de ani până ne vom da seama!

PS: Linkul cu pricina și în engleză.

1 Comment

HackersAzi, 19 decembrie 2015 pe Ziarul de Gardă a apărut un articol cu titlu "Centrul de Telecomunicaţii Speciale al R. Moldova l-a votat pe Plahotniuc prim-ministru. Lista postacilor de partid".

Și au început să curgă share-urile și comentariile depsre CTS capturat, despre utilizarea resurselor administrative, blablabla.

Pentru început vă spun că nu un fan al Dl Plahotniuc, însă așa articole manipulatorii mă scoate din sărite. Deci să le luăm pe rând.

1. Din titlu reiese că Centrul de Telecomunicaţii Speciale al R. Moldova l-a votat pe Plahotniuc prim-ministru. De unde? Conform textului de pe niște IP-uri care aparțin CTS-ului s-a votat masiv. CTS nu are de unde ști ce se petrece pe rețeaua sa internă, el într-o oarecare măsură protejează rețeau însă nu contra navigării normale a unui utilizator pe zdg.

2. "Această manipulare/falsificare a sondajului de pe zdg.md." Dragii mei de la zdg, orice sondaj se face conform ip-urilor unice care au votat, asta v-o spune orice studente de la IT. Deci dacă făceați aceasta de la CTS nu se vota masiv. Această situație cu voturile masive este absolut la orice sondaj, fie el pentru Plahotniuc sau Papa de la Roma.

3. "de câteva luni, știrile și investigațiile publicate pe zdg.md înregistrează tot mai multe comentarii care provin de la un număr restrâns de IP-uri", e normal să specificați că aceste IP-uri deja aparțin Moldtelecomului și nu CTS-ului.

Lumea mai puțin școlită tehnic își face concluzia, că o armată de postaci stau pe o instituție guvernamentală de care Șeful CTS-ului știe și îi protejează și ei fac postari de laudă lui Pahotniuc.

În realitate cineva de la un calculator a unei instituții de stat, deservit de CTS, a apăsat un buton, sau chiar și-a făcut un script în câteva minute să se apese singur (pentru că sondajul e varză tehnic) și care nu poate fi numit utilizarea resurselor administrative. Iar cu totul de la un alt provider, pentru utilizatorii casnici, stau niște postaci să scriu despre Plahotniuc.

Fața jurnalistului după ce a văzut abonamentele.

Fața jurnalistului după ce a văzut abonamentele.

Astăzi se face o lună de la întroducerea abonamentelor la Privesc.Eu.

1. Din 514 live-uri 87 au fost transmise doar pentru abonati. (Am promis 30-60)

2. Unele televiziunile mici și-au cumpărat abonament, însă televiziunile mari ori cerșeau unul gratuit ori au spus că e prea mare.

3. Jurnaliștii au început să iasă din birouri, deși e mult mai ieftin să-și cumpere un abonament (desigur șefii iau decizia).

4. Mulți au spus abonamentul e mare, deși 30/87=0.34 euro per event, consider ca e ok.

5. Am făcut un abonament de 5 euro, pentru cei care privesc ocazional. Culmea, a cumpărat un om care a făcut greva foamei. Iar alții care au promis că vor cumpăra un așa abonament s-au dat cu c. la gard.

6. Desigur unii au venit cu idei geniale de a plăti per event. Problema e că 50% se va duce pe taxele bancare.

Iacașa, un business moldovenesc/românesc.

Google Calendar, la timpul lui de apariție a ucis o mulțime de startup-uri care încercau să rezolve  problema de management a timpului.

E un serviciu destul de bun care vine odată cu crearea unui cont Google. Ce-mi place mie mult la acest servicu, este posibilitatea de a fi alertat prin SMS  sau email când se începe vreun eveniment din calendarul tău. O altă funcționalitate este posibilitatea de a adăuga oricâte calendare doreși care sunt publice sau distribuite de prietenii tăi.

A venit timpul și altor start-uri să se folosească de aceste funcționalități, oferite gratis de Google.

Privesc.Eu Agenda se integrează în Google Calendar.

E destul să intrați pe pagina cu agenda, să dați click la butonul Adaugă la calendarul personal și apoi mergeți la Calendar Settings,  la tab-ul Reminders and Notifications și setați notificările prin Email sau SMS.

Calendar Settings

 

 

 

Calendar Remainders

Voila!, acum primești SMS-uri gratuite când privesc.eu începe live-uri, sau agenda zilnică prin email.

Ca să încep în stilul primelor televiziuni, primelor portale… Privesc.Eu a devenit încet, încet cel mai mare distribuitor de date din Moldova. Doar tehnicienii știu că internetul este plătit atât de client cât și de site. Un utilizator obișniut plătește unui provider în jur de 5-20 euro lunar, în schimb privesc.eu care are mii de utilizatori plătește zeci de mii de euro anual pentru servere și traficul distribuit providerilor din Moldova, România și Europa. Ca să vă lămuresc dintr-o altă perspectivă: Operatorii de Internet mobil fac mult mai mulți bani pe clienții care consumă video pe www.privesc.eu decât Privesc.Eu.

Din necunoștință de situație, mulți organizatori de evenimente consideră www.privesc.eu că este ca și un TV obișnuit. Ceea ce nu este adevărat. Un TV clasic are cheltuieli distribuție fixe, indiferent de numărul de oameni care privesc acel TV, privesc.eu plătește providerului său pentru fiecare om care privește. Cu cât evenimentul e mai popular cu atât cheltuielile noastre sunt mai mare la acel eveniment. Pe de altă parte TV-ul clasic e restricționat să dea doar un singur eveniment pe când privesc.eu e limitat doar de numărul de operatori.

Odată cu creșterea popularității site-ului, cheltuielile de operare cresc liniar. Nu mai putem crește doar din evenimentele plătite, ele sunt destul de puține, însă noi ne dorim să transmitem live cât mai multe evenimente.

De aceea, pentru a continua dezvoltarea acestui proiect, îndrăgit de toți, am creat abonamente. La prima vedere 29.99 euro e mult, însă dacă împarți la 30 zile. Avem un euro/zi = cu o cafe. E o nimica toată pentru cetățenii care doresc să vadă evenimentele cu ochii proprii, nu prin interpretări jurnalistice.

Odată cu creșterea abonaților vom angaja tot mai mulți operatori prin țară, pentru a filma cât mai multe evenimente. Scopul inițial e să facem macar câte 1-2 evenimente zilnic doar pentru membrii clubului Privesc.Eu, restul fiind publice și gratuite ori plătite de către organizatori.

Pentru cititorii mei fideli, am făcut și un discount de 5 euro lunar.

Enjoy.

Aseară, la TEDx Chișinău a fost arătat un video despre Bitcoin. Video a fost ok. Însă am rămas profund dezamăgit de discuțiile din sală referitor la valute virtuale, digitale, fiat, cryptocurrency și gamification. Puțini aveau idee cum lucrează macăr unul din aceste sisteme deși informație despre transfer de valoare în societate este cu nemiluita.

Din toate discuțiile acele am ajuns la concluzia că noi, #dindragoste pentru Moldova, ne este lene să studiem lumea tehnică, matematică și fizică care ne înconjoară.

Fiind student umblam ca dracu după tot ce se tipărea despre IT și ce ajungea prin Chișinău. Gaseam câte ceva pe la librăria Știința, enervat pe țara asta că nu găsec informație. Însă odată cu apariția Internetului în Moldova practic am devenit obsedat de studierea noilor tehnologii. Sunt limitat doar de timp! Ura! Acum toți vor fi deștepți!

În schimb noi am căpătat o generație de leneși. Birocrații folosesc IT doar pentru a spăla banii, că doar în tenderele de soft pentru instituții poți scrie prețurile dorite. Poliția, cică, pentru pornografie infantilă. Politicienii pentru a se murdări în continuare unul pe altul. Jurnaliștii pentru a manipula fără obraz.

Având la dispoziție rețele de cea mai bună calitate, telefoane 4G, notebook-uri, iPad-uri, smartphone, youtube, wikipedia, quora, am căpătat o generație de egoiști care folosesc Internetul pentru selfie, cancan online, playboy, mâncare pe Instagram, foto de la discoteci, cerșit de like-uri, share-uri de mâțâșori.

O generație de animale sociale.