Cinzia, è basata sui modelli linguisti di OpenAI, in particolare GPT 3.5 e GPT4.
I grandi modelli linguistici di OpenAI, inclusi quelli che alimentano Cinzia, sono sviluppati utilizzando tre fonti principali di informazioni: (1) informazioni pubblicamente disponibili su Internet, (2) informazioni che otteniamo in licenza da terze parti e (3) informazioni fornite dai nostri utenti o dai nostri formatori umani.Questo articolo fornisce una panoramica sulle informazioni pubblicamente disponibili che utilizziamo per aiutare lo sviluppo dei nostri modelli e su come raccogliamo e utilizziamo tali informazioni in conformità alle leggi sulla privacy. Per comprendere come raccogliamo e utilizziamo le informazioni dagli utenti dei nostri servizi, inclusa la possibilità di evitare che le conversazioni con Cinzia vengano utilizzate per insegnare ai nostri modelli, si prega di consultare la nostra Informativa sulla privacy e questo articolo del centro assistenza.
Cos'è CINZIA e come funziona?
Cinzia è un servizio basato sull'intelligenza artificiale a cui si può accedere tramite Internet. Cinzia può essere utilizzato per organizzare o riassumere testo, o per scrivere nuovi testi. Cinzia è stato sviluppato in modo tale da poter comprendere e rispondere alle domande e alle istruzioni dell'utente. Questo avviene tramite la lettura di una grande quantità di testo esistente e l'apprendimento di come le parole tendono a comparire in un determinato contesto con altre parole. Utilizza poi ciò che ha appreso per prevedere la parola successiva più probabile che potrebbe comparire in risposta alla richiesta dell'utente e ogni parola successiva a quella. Questo è simile alle capacità di autocompletamento presenti sui motori di ricerca, sui telefoni cellulari e sui programmi di posta elettronica.
Per esempio, durante il processo di apprendimento del modello (chiamato "addestramento"), potremmo far completare una frase al modello: "invece di girare a sinistra, ha girato ___". Prima dell'addestramento, il modello risponderà con parole casuali, ma leggendo e apprendendo da molte righe di testo, capirà meglio questo tipo di frase.
Poiché ci sono molte parole possibili che potrebbero seguire in questa frase (ad esempio, invece di girare a sinistra, ha girato "a destra", "intorno" o "indietro"), c'è un elemento di casualità nel modo in cui un modello può rispondere, e in molti casi i nostri modelli risponderanno alla stessa domanda in modi diversi.
I modelli di apprendimento automatico sono composti da grandi stringhe di numeri, chiamati "pesi" o "parametri", e da codice che interpreta ed esegue tali numeri. I modelli non contengono o memorizzano copie delle informazioni che apprendono. Invece, mentre un modello apprende, alcuni dei numeri che lo compongono cambiano leggermente per riflettere ciò che ha appreso. Nell'esempio sopra, il modello ha letto informazioni che l'hanno aiutato a passare dalla previsione di parole casuali e sbagliate alla previsione di parole più accurate, ma tutto ciò che è successo effettivamente nel modello stesso è stato che i numeri sono cambiati leggermente. Il modello non ha memorizzato o copiato le frasi che ha letto
Che tipo di informazioni vengono utilizzate per insegnare a Cinzia?
Come accennato in precedenza, Cinzia e i nostri altri servizi vengono sviluppati utilizzando (1) informazioni disponibili pubblicamente su Internet, (2) informazioni che acquisiamo in licenza da terze parti e (3) informazioni fornite dai nostri utenti o dai nostri formatori umani. Questo articolo si concentra sul primo set: informazioni disponibili pubblicamente su Internet.
Per questo set di informazioni, utilizziamo solo informazioni pubblicamente disponibili liberamente e apertamente su Internet, ad esempio non cerchiamo informazioni dietro paywall o dal "web oscuro". Applichiamo filtri e rimuoviamo informazioni che non vogliamo che i nostri modelli imparino o producano, come discorsi di odio, contenuti per adulti, siti che aggregano principalmente informazioni personali e spam. Quindi utilizziamo le informazioni per insegnare ai nostri modelli. Come menzionato nella sezione precedente, Cinzia non copia o memorizza le informazioni di addestramento in un database. Invece, apprende le associazioni tra le parole e questi apprendimenti aiutano il modello a aggiornare i suoi numeri/pesi. Il modello utilizza quindi tali pesi per prevedere e generare nuove parole in risposta a una richiesta dell'utente. Non "copia e incolla" le informazioni di addestramento - proprio come una persona che ha letto un libro e lo posa, i nostri modelli non hanno accesso alle informazioni di addestramento dopo aver appreso da esse.
Vengono utilizzate informazioni personali per insegnare a Cinzia?
Una grande quantità di dati su Internet riguarda le persone, quindi le informazioni di addestramento includono incidentalmente informazioni personali. Non cerchiamo attivamente informazioni personali per addestrare i nostri modelli.
Utilizziamo le informazioni di addestramento solo per aiutare i nostri modelli a imparare il linguaggio e come comprenderlo e rispondere ad esso. Non useremo alcuna informazione personale nelle informazioni di addestramento per creare profili sulle persone, contattarle, pubblicizzare loro, cercare di vendergli qualcosa o vendere le informazioni stesse.
I nostri modelli possono apprendere dalle informazioni personali per capire come cose come nomi e indirizzi si adattano al linguaggio e alle frasi, o per apprendere su persone famose e figure pubbliche. Ciò rende i nostri modelli migliori nel fornire risposte pertinenti.
In che modo lo sviluppo di Cinzia è conforme alle leggi sulla privacy?
Utilizziamo le informazioni di addestramento in modo lecito. I grandi modelli di linguaggio hanno molte applicazioni che offrono significativi vantaggi e stanno già aiutando le persone a creare contenuti, migliorare il servizio clienti, sviluppare software, personalizzare l'istruzione, supportare la ricerca scientifica e molto altro. Tuttavia, questi benefici non possono essere realizzati senza una grande quantità di informazioni per addestrare i modelli. Inoltre, il nostro utilizzo delle informazioni di addestramento non ha lo scopo di avere un impatto negativo sugli individui e le fonti di queste informazioni di addestramento sono già disponibili pubblicamente. Per queste ragioni, basiamo la raccolta e l'utilizzo di informazioni personali incluse nelle informazioni di addestramento sui legittimi interessi ai sensi delle leggi sulla privacy come il GDPR. Per adempiere ai nostri obblighi di conformità, abbiamo anche completato una valutazione dell'impatto sulla protezione dei dati per garantire che stiamo raccogliendo e utilizzando queste informazioni in modo legale e responsabile.
Rispondiamo alle richieste di obiezione e diritti simili. A seguito dell'apprendimento del linguaggio, le risposte di Cinzia possono talvolta includere informazioni personali su individui il cui nome appare più volte su Internet pubblico (ad esempio, personaggi pubblici). Gli individui in determinate giurisdizioni possono opporsi al trattamento delle loro informazioni personali da parte dei nostri modelli compilando questo modulo. Gli individui possono anche avere il diritto di accedere, correggere, limitare, cancellare o trasferire le loro informazioni personali che possono essere incluse nelle nostre informazioni di addestramento. È possibile esercitare questi diritti contattando info@pineappsrl.com
Si prega di essere consapevoli del fatto che, in conformità alle leggi sulla privacy, alcuni diritti potrebbero non essere assoluti. Potremmo rifiutare una richiesta se abbiamo una giustificazione legale per farlo. Tuttavia, ci sforziamo di dare la massima priorità alla protezione delle informazioni personali e di conformarci a tutte le leggi sulla privacy applicabili. Se ritieni che non abbiamo affrontato adeguatamente un problema, hai il diritto di presentare un reclamo presso l'autorità di controllo locale competente.
Proteggiamo le informazioni di addestramento e limitiamo il modo in cui vengono utilizzate e condivise. Per mantenere al sicuro queste informazioni, utilizziamo misure tecniche, fisiche e amministrative commercialmente ragionevoli come controlli di accesso, registri di audit, autorizzazioni in sola lettura e cifratura dei dati archiviati. Per ulteriori informazioni sulle nostre pratiche di sicurezza, si prega di visitare il sito https://www.cinzia.app/privacy-policy
Adottiamo anche misure per ridurre il trattamento delle informazioni personali durante l'addestramento dei nostri modelli. Ad esempio, rimuoviamo i siti web che aggregano grandi volumi di informazioni personali e cerchiamo di addestrare i nostri modelli a rifiutare le richieste di informazioni private o sensibili sulle persone.
Non vendiamo le informazioni di addestramento a terzi e divulgiamo solo parti delle informazioni quando necessario e coerentemente con la nostra Informativa sulla Privacy.
Conserviamo queste informazioni solo per il tempo necessario a servire il suo scopo previsto. La durata della conservazione dipende da fattori come la quantità, il tipo e la sensibilità delle informazioni, il rischio di danno derivante dall'uso o dalla condivisione non autorizzati, se le informazioni sono ancora necessarie o utili per addestrare o aggiornare i nostri modelli e qualsiasi requisito legale.
Il nostro responsabile del trattamento dei dati ai sensi del GDPR è PineApp srl, con sede in Via Appia 31, Imola, Italia. Per informazioni sul nostro rappresentante per la protezione dei dati, si prega di consultare la nostra Informativa sulla privacy. Il nostro Responsabile della protezione dei dati può essere contattato all'indirizzo info@pineappsrl.com