CzNaPy: Często Nas Pytają

💼

Pytania biznesowe

01 Co jest waszym realnym IP, którego klient nie odtworzy łatwo sam? +

Nasz miś. Serio — mamy zarejestrowany znak towarowy "Miś AI" (w trakcie). Poza tym nasze IP to unikalne podejście do chłodzenia GPU górskim powietrzem na wysokości 832 m n.p.m. Czy klient to odtworzy? Tylko jeśli ma biuro na Podhalu. A tam jest drogo, bo turyści.

02 Czy jedyną cechą wyróżniającą jest on-premise? +

On-premise to za mało powiedziane. U nas to on-mountain. Dane klienta nigdy nie opuszczają Podhala. Czy Miś-zrobiDZIŚ to "średniej jakości agent do programowania z lokalnym modelem"? Nie, to jest podhalański agent do programowania z lokalnym modelem. Zupełnie co innego. Czujesz ten górski powiew?

03 Co jest gotowym produktem, a co usługami wdrożeniowymi? +

Gotowym produktem jest landing page. Reszta to usługi wdrożeniowe, które wdrażamy głównie w przyszłości. Miś-dowcipNIŚ jest "Dostępny wkrótce™" — ten znak towarowy też rejestrujemy. Miś-Viś jest w "Becie zamkniętej" — zamkniętej na klucz, bo jeszcze nie działa. Miś-Drive jest "w fazie testów konceptualnych", co oznacza, że konceptualnie testujemy, czy to w ogóle da się zrobić.

04 Skąd pochodzi deklarowany wzrost produktywności 30–55%? +

Mierzymy to metodą "przed kawą i po kawie". Przed kawą zespół ma produktywność zero. Po kawie — wzrost jest nieskończony, ale konserwatywnie raportujemy 30–55%. Case studies mamy jedno: nasz CTO zaczął używać ChatGPT i teraz pisze maile szybciej. Metryki: wcześniej pisał jeden mail dziennie, teraz — dwa.

05 Ilu macie inżynierów ML i security? +

Nasz zespół to "najlepsze umysły w Polsce" — tak jest napisane na stronie, więc to musi być prawda. Konkretnie: mamy jednego inżyniera ML, który jest jednocześnie inżynierem security, DevOpsem, front-end developerem i osobą odpowiedzialną za catering oscypkowy. Doświadczenie w regulowanych branżach? Regulujemy temperaturę w biurze ręcznie, bo nie mamy ogrzewania.

06 Ile macie wdrożeń produkcyjnych i u jakich klientów? +

Zaufali nam: Sklep U Zośki, PKS Nowy Targ i Oscypkolandia™. U Zośki wdrożyliśmy system rekomendacji, który zawsze rekomenduje oscypek. Accuracy: 100%, bo w sklepie jest tylko oscypek.

07 Jak w praktyce zapewniacie zgodność z RODO? +

Nie zbieramy danych osobowych, bo nasz system jeszcze nie działa. To najbezpieczniejsze podejście do RODO: zero danych = zero problemów. A jak zacznie działać, to się zastanowimy. NIP mamy "w trakcie", więc UODO nas jeszcze nie znajdzie.

⚙️

Pytania techniczne

01 Czy sami trenujecie/dotrenowujecie modele? +

a) Fine-tuning: Stosujemy metodę "LoRA, ale z sercem". W praktyce downloadujemy model z HuggingFace i zmieniamy system prompt na "Jesteś polskim misiem".

b) Języki inne niż angielski: Nasz model rozumie 7 polskich dialektów. Angielski — średnio. Ale kto potrzebuje angielskiego na Podhalu?

c) Własne dane treningowe: Trenujemy na pełnym archiwum polskiej Wikipedii, przepisach na oscypek i "prywatnych wiadomościach założyciela z 2017 roku (za zgodą)". Dokładnie tak, jak napisaliśmy na stronie.

d) Modele ASR: Whisper, ale mówi z podhalańskim zaśpiewem.

02 ASR: jak radzicie sobie ze specjalistycznym słownictwem i jakością nagrań? +

Nasz system ASR rozpoznaje słowa "oscypek", "hej!" i "baca" z accuracy 99.7% (na naszych danych). Słownictwo prawnicze? Rozpoznajemy słowo "pozew", bo dostajemy dużo pozwów. Diaryzacja? Zakładamy, że mówi jeden miś.

03 Najtrudniejszy nierozwiązany problem techniczny? +

Ogrzewanie biura. Technicznie: "emitujemy mniej niż nic", bo nie mamy ogrzewania. Zespół pracuje w rękawiczkach od listopada do marca.

04 Jakie macie benchmarki? Jak mierzycie jakość RAG? +

Accuracy: 99.7% — na naszych danych. Mierzymy jakość RAG metodą "czy odpowiedź wspomina oscypek?" Jeśli tak — relevant. Jeśli nie — hallucination. Benchmark score jest wyższy dzięki lokalizacji na 832 m n.p.m. (to nie żart — to jest na stronie).

05 Jak konkretnie zapobiegacie wyciekom danych i prompt injection? +

Jedno hasło do całego systemu. Jakie? Nie mogę powiedzieć, ale rymuje się z "oscypek". Prompt injection blokujemy poprzez to, że nasz model nie rozumie skomplikowanych promptów.

06 Czy macie formalny threat model lub audyt bezpieczeństwa? +

Nasz model zagrożeń: (1) niedźwiedź wchodzi do serwerowni, (2) turyści pytają o WiFi, (3) brak prądu gdy wieje halny. Audyt bezpieczeństwa? Pies pasterski regularnie patroluje biuro.

07 Jakie są realne wymagania sprzętowe? +

Jeden laptop, górskie powietrze i stabilne łącze (tego jeszcze nie mamy). GPU chłodzone naturalnie — zaleta lokalizacji. RAM: "wystarczająco". Realne wymagania? Niedostępne, bo jeszcze nie testowaliśmy na niczym większym niż demo na stronie.

08 Jakie macie typowe latency i ilu użytkowników system obsłuży? +

3ms latency — w Polsce. Konkretnie: w promieniu 50 metrów od naszego biura. Dalej — zależy od pogody. Ilu użytkowników jednocześnie? Na razie testowaliśmy z jednym. Było dobrze.

Często Nas Pytająodpowiada CEO Miś AI 🐻

Pytania biznesowe

Pytania techniczne

Często Nas Pytają
odpowiada CEO Miś AI 🐻