Witaj! 👋
W tym tygodniu nie było mi łatwo wziąć się za newsletter. Dopadła mnie choroba i miałem mniej sił. Natomiast na newsletterze jest już ponad 1.600 osób i nie chciałem zawieźć moich czytelników. Dziękuję Ci, że jesteś i czytasz newsletter! To Ty mi dajesz siłę, by mimo lenistwa lub choroby wstać i działać! 💪
Zatem jak co piątek przybywam do Ciebie z porcją najświeższych wiadomości ze świata data science, AI, ML & danych!
Przyjemnej lektury! 📚📊🤖 |
|
|
|
Google walczy z dezinformacją 💪
👉 Google wprowadza nowe funkcje oparte na sztucznej inteligencji, aby zapewnić większy kontekst obrazom i źródłom, które można znaleźć w Internecie. Google przeciwdziała rozprzestrzenianiu się dezinformacji, udostępniając użytkownikom więcej informacji umożliwiających ocenę tego, co widzą. Obejmuje to wyświetlenie historii obrazu, metadanych i sposobu, w jaki inni go opisują. W przypadku źródeł sztuczna inteligencja wygeneruje opisy podsumowujące informacje z wiarygodnych witryn. Docelowo są to praktyczne narzędzia, które przy minimalnym wysiłku ze strony użytkowników zwiększają wiarygodność online. W epoce szybkiego rozprzestrzeniania się wirusowych kłamstw poprawa dostępności funkcji weryfikacyjnych pomaga promować zdrowszy ekosystem informacji online. Te stopniowe rozszerzenia optymalizują istniejące możliwości sprawdzania faktów, zamiast wprowadzać zupełnie nowe paradygmaty. Google sprytnie celuje w konkretne problemy związane z nieznanymi źródłami i wyrwanymi z kontekstu obrazami, które można łatwo wykorzystać. Bardzo kibicuję! Podoba mi się ten kierunek! [LINK]
|
|
|
|
Woodpecker 🐦
👉 Halucynacje to główny problem nękający konwersacyjną sztuczną inteligencję, generujący fałszywe informacje. Naukowcy z Chin opracowali system o nazwie Woodpecker (dzięcioł), który według doniesień może wykrywać i korygować halucynacje w multimodalnych modelach sztucznej inteligencji, takich jak GPT-4. Narzędzie Woodpecker sprawdza poprawność tekstu względem obrazów za pomocą 5-etapowego potoku w celu zidentyfikowania niespójności. Poprawiło to dokładność MiniGPT-4 o ponad 30% w testach porównawczych poprzez przejrzyste modyfikacje. Dlaczego to ma znaczenie? Bo AI generująca przekonujące (ale błędne) halucynacje jest jednym z największych problemów do rozwiązania w LLM, a Woodpecker może być początkiem wielkiego przełomu w kierunku bardziej niezawodnych wyników. [LINK]
|
|
|
|
Nightshade 🌙
👉 Uniwersytet w Chicago udostępnia nowe narzędzie o nazwie Nightshade, które umożliwia artystom dodawanie niewidocznych zmian w pikselach w ich dziełach przed opublikowaniem ich w Internecie. To „zatruwa” obrazy, przez co uszkadzają modele AI, jeśli zostaną pobrane w celu uzyskania danych szkoleniowych bez pozwolenia. Nightshade wykorzystuje luki w zabezpieczeniach modeli obrazów AI i zmienia przesłaną grafikę (bez zmiany samej grafiki), aby modele nauczyły się nieprawidłowych skojarzeń. Nightshade może wywierać presję na firmy zajmujące się sztuczną inteligencją, aby szanowały prawa artystów i płaciły tantiemy. Choć mam nadzieję, że firmy już dojrzały do tego, aby modele trenować na danych, do których mają prawo. [LINK]
|
|
|
|
👉 Apple stanęło w miejscu, gdy ChatGPT i inne narzędzia AI szturmem podbiły branżę technologiczną. Jednak firma przygotowuje teraz odpowiedź i planuje opracować funkcje dla pełnej gamy swoich urządzeń. Poznaj wielki plan Apple mający na celu wprowadzenie generatywnej sztucznej inteligencji na wszystkie swoje urządzenia! [LINK]
👉 Microsoft ma ponad milion płacących użytkowników Github Copilot! [LINK]
👉 Amazon udostępnił narzędzie AI, które automatycznie generuje zdjęcia produktów lifestylowych do reklam, dzięki czemu użytkownicy mogą szybko dodawać produkty i tworzyć odpowiednie kontekstowo sceny. Ograniczenie pracy twórczej za pomocą narzędzi AI to zmiana zasad gry dla reklamodawców, którym brakuje czasu. [LINK]
👉 Chińskie instytucje zgłosiły w 2022 r. 29 853 patenty związane ze sztuczną inteligencją, czyli o prawie 80% więcej niż w USA, gdzie liczba zgłoszeń spadła o 5,5%. Chiny reprezentują obecnie ponad 40% światowych wniosków patentowych na AI złożonych w ubiegłym roku. Podkreśla to zaangażowanie kraju w kształtowanie przyszłości technologii sztucznej inteligencji. [LINK]
👉 Naukowcy z firmy NVIDIA stworzyli agenta sztucznej inteligencji o nazwie Eureka, który może automatycznie generować algorytmy do szkolenia robotów, umożliwiając im szybsze uczenie się złożonych umiejętności. [LINK]
👉 Około 60 organizacji praw człowieka opublikowało na platformie Liberties list otwarty skierowany do europejskich prawodawców, w którym wzywają, aby ustawa o sztucznej inteligencji wymagała od UE przyjęcia solidnych zabezpieczeń w celu ochrony samego fundament Unii. [LINK]
👉 DALL·E 3 jest teraz dostępny w ChatGPT Plus i Enterprise. OpenAI twierdzi, że dodało do niego szereg zabezpieczeń przed udostępnieniem go wszystkim płatnym użytkownikom. [LINK]
|
|
|
|
👉 Gemini firmy Google to kolejny wyczekiwany model w przestrzeni AI. Jednak według wycieku w Google Makerssuite może pojawić się nowe narzędzie o nazwie Stubbs, które umożliwia łatwe wizualne tworzenie podstawowych aplikacji prototypowych sztucznej inteligencji bez konieczności stosowania kodu. [LINK]
👉 Reddit chce blokować roboty wyszukiwania — firma chce, aby firmy zajmujące się generatywną sztuczną inteligencją, takie jak OpenAI, płaciły za pobieranie treści z Reddita w celu szkolenia modeli sztucznej inteligencji. Jeśli firmy nie dojdą do porozumienia, Reddit może całkowicie zablokować roboty wyszukiwarek. [LINK]
👉 Celem FCC jest zbadanie zagrożeń związanych z automatycznymi połączeniami telefonicznymi wspomaganymi sztuczną inteligencją i ich zgodności z przepisami konsumenckimi. Dochodzenie przeanalizuje wpływ sztucznej inteligencji na ramy regulacyjne, potwierdzi zasadność informacji generowanych przez sztuczną inteligencję i wytyczy kierunek przyszłej polityki. [LINK]
👉 Lenovo i Nvidia ogłosiły rozszerzone partnerstwo w celu dostarczania kompleksowych rozwiązań AI, które umożliwią firmom łatwe tworzenie i wdrażanie niestandardowych modeli sztucznej inteligencji. [LINK]
👉 Wyszukiwarka AI You.com uruchomiła sztuczną inteligencję Smart Personalization, aby dostosować odpowiedzi na podstawie zainteresowań użytkownika, obserwacji i preferencji uczenia się, by automatycznie aktualizować profile. [LINK]
👉 Bill Gates przewiduje, że sztuczna inteligencja mogła osiągnąć maksymalny pułap i uważa, że GPT-5 nie będzie dużym skokiem. [LINK]
👉 Midjourney ma nową stronę internetową i przygotowuje poważną aktualizację. [LINK]
👉 Ravi Sen, profesor nadzwyczajny zarządzania informacjami i operacjami w Mays Business School, uważa, że postępy AI mogą oznaczać koniec branży SEO, jaką znamy. Dzięki niektórym najnowszym funkcjom wyszukiwania opartym na sztucznej inteligencji firmy technologiczne omijają tradycyjną ścieżkę wyszukiwania, oferując użytkownikom listę linków i zamiast tego oferując im bezpośrednie odpowiedzi za pomocą chatbotów, takich jak Bard i ChatGPT. [LINK]
👉 Naukowcy opracowali system sztucznej inteligencji, który może uogólniać język podobnie jak ludzie. System AI radzi sobie mniej więcej tak dobrze, jak ludzie, jeśli chodzi o składanie nowo poznanych słów w istniejącym słownictwie i używanie ich w nowych kontekstach, co jest kluczowym aspektem ludzkiego poznania, znanym jako systematyczne uogólnianie. [LINK]
👉 Podczas konferencji Google poświęconej wynikom za trzeci kwartał inwestorzy domagali się szczegółów na temat tego, w jaki sposób firma planuje czerpać zyski z inwestycji w sztuczną inteligencję. Choć dyrektorzy podkreślali wczesny sukces reklam i zbliżające się wprowadzenie narzędzia Search Generative Experience (SGE), nadal pozostawały pytania dotyczące harmonogramu monetyzacji sztucznej inteligencji. [LINK]
👉 Stanford publikuje indeks przejrzystości modelu Foundation, aby ocenić przejrzystość LLM. [LINK]
|
|
|
|
👉 Apple dołącza do konkurencji w dziedzinie generatywnej sztucznej inteligencji i prezentuje Matryoshka Diffusion Models (MDM) – zaawansowany model generatywny do tworzenia obrazów i filmów o wysokiej jakości. [LINK]
|
|
|
|
👉 Microsoft i Harvard są przekonani, że GPT-4 osiąga lub nawet przewyższa obecne wiodące modele specjalistyczne w dziedzinie radiologii w zastosowaniach tekstowych do sporządzania raportów radiologicznych, notując bezwzględny wzrost wydajności na poziomie około 10% w niektórych zadaniach. [LINK]
👉 Twelve Labs przedstawia Pegasusa-1 – podstawowy model języka wideo 80B, zdolny do multimodalnego rozumienia wideo. [LINK]
|
|
|
|
👉 Naukowcy przedstawiają HallusionBench – nowy punkt odniesienia do analizy modeli wizjonersko-językowych (VLM), takich jak GPT-4V i LLaVA-1.5. [LINK]
👉 Apple i Uniwersytet Illinois wprowadzają SAM-CLIP — połączenie modeli Vision Foundation Models CLIP i SAM, umożliwiające osiągnięcie wyników SOTA w zakresie zero-shot segmentacji semantycznej. [LINK]
|
|
|
|
👉 Yale i Google publikują HyperAttention, aby zwiększyć efektywność modeli językowych w obsłudze długich sekwencji danych, wykazując nawet 5-krotne przyspieszenie czasu przetwarzania. [LINK]
👉 DeepMind przedstawia Step-Back Prompting — dwuetapowy proces abstrakcji i wnioskowania skutkujący znacznym wzrostem wydajności, w tym poprawą o 27% w przypadku TimeQA i do 36% w porównaniu z innymi metodami podpowiedzi. [LINK]
|
|
|
|
👉 Poznaj LAMP - framework AI do uczenia się wzorców ruchu za pomocą modeli dyfuzji tekstu na obraz. [LINK]
👉 SOTOPIA – innowacyjne środowisko, które symuluje złożone interakcje społeczne pomiędzy sztucznymi agentami w celu oceny ich inteligencji społecznej. [LINK]
|
|
|
|
👉 Show-1 - zamień tekst na wideo. [LINK]
👉 Naukowcy przedstawiają FreeNoise – metodę rozszerzania generowania wideo opartego na tekście w przypadku dłuższych filmów. [LINK]
|
|
|
|
👉 OpenAgent to otwarta platforma, która umożliwia zarówno użytkownikom niebędącym ekspertami, jak i programistom interakcję z agentami językowymi i hostowanie ich w celu wykonywania różnych codziennych zadań, takich jak analiza danych, przeglądanie stron internetowych i nie tylko, przy jednoczesnym wspieraniu innowacji w dziedzinie agentów językowych. [LINK]
👉 Nvidia przedstawia Eurekę – agenta AI wykorzystującego LLM do generowania kodu, który szkoli roboty do wykonywania złożonych zadań. [LINK]
👉 liteLLM - wywołuj wszystkie interfejsy API LLM przy użyciu formatu OpenAI. Użyj Bedrock, Azure, OpenAI, Cohere, Anthropic, Ollama, Sagemaker, HuggingFace, Replicate … (ponad 100 LLM). [LINK]
👉 Zero123 - twórz wiele obrazów z różnych perspektyw na podstawie jednego obrazu. [LINK]
👉 Jina-embeddings-v2 — pierwszy na świecie opensourceowy model embeddingów zwracający wektory o długości 8 tys., wykazujący wydajność porównywalną z modelami OpenAI. [LINK]
👉 AutoExpert oferuje skuteczny zestaw niestandardowych instrukcji zaprojektowanych w celu poprawy wydajności GPT-4 i GPT-3.5-Turbo, optymalizując odpowiedzi pod kątem głębi i kontekstu. [LINK]
👉 Voyager od Spotify — szybkie przybliżone wyszukiwanie najbliższego sąsiada na zbiorze wektorów w pamięci. [LINK]
👉 SSD-1B - najszybszy jak dotąd model open source zamiany tekstu na obraz, 50% mniejszy i 60% szybszy niż SDXL! [LINK]
|
|
|
|
👉 Embeddings - czym są i dlaczego są ważne? [LINK]
👉 6 złych nawyków zabijających Twoją produktywność w nauce danych. [LINK]
👉 Post przeznaczony głównie dla analityków danych i inżynierów uczenia maszynowego, którzy chcą lepiej zrozumieć podstawowe potoki danych w celu obsługi funkcji przewidywania w czasie rzeczywistym. [LINK]
|
|
|
|
👉 Krótki kurs o funkcjach, narzędziach i agentach w LangChain. [LINK]
👉 Niezależnie od tego, czy jesteś ekspertem w dziedzinie GIS, czy nigdy wcześniej nie tworzyłeś map, jeśli interesuje Cię tworzenie map z danymi, z pewnością nauczysz się czegoś przydatnego podczas tego wyzwania. [LINK]
👉 Niesamowity kurs głębokiego uczenia się prowadzony przez François Fleuret na Uniwersytecie Genewskim w Szwajcarii. Kurs stanowi dokładne wprowadzenie do głębokiego uczenia się, z przykładami w frameworku PyTorch. Wszystko jest ogólnodostępne, łącznie z materiałami informacyjnymi, slajdami i nagraniami. [LINK]
👉 Obszerny przewodnik na temat tworzenia i przeprowadzania ewaluacji LLM oraz tego, dlaczego podczas porównywania szablonu podpowiedzi LLM należy stosować precyzję i recall. [LINK]
|
|
|
|
👉 Oto zestaw interaktywnych dashboardów umożliwiających eksplorację użycia hiperparametru do dostrajania liniowych modeli uczenia maszynowego. [LINK]
👉 Artykuł wyjaśniający, jak wdrożyć zaawansowany potok RAG przy użyciu osadzania, pamięci podręcznej, wyszukiwania hybrydowego i narzędzia do wyszukiwania zespołów w celu poprawy jakości i trafności generowania tekstu. [LINK]
👉 Artykuł o Step-Back Prompting - technice podpowiedzi umożliwiającej LLM wykonywanie abstrakcji i wyprowadzanie koncepcji wysokiego poziomu. [LINK]
👉 Chip Huyen wprowadza multimodalność, kategoryzuje zadania multimodalne, wyjaśnia wpływowe architektury i omawia aktywne obszary badawcze dotyczące dużych modeli multimodalnych. [LINK]
👉 W tym artykule zagłębisz się w świat LLM. Dowiesz się, czym są LLM, jak działają, jaki jest ich wpływ na różne domeny i wreszcie czym jest LLMOps. [LINK] |
|
|
|
👉 Google, Microsoft, OpenAI i Anthropic ogłosiły, że wspólnie sfinansują nowe badania nad bezpieczeństwem sztucznej inteligencji i tworzenie zespołów czerwonych. [LINK]
👉 Zegarek Apple robi postępy w rozpoznawaniu choroby Parkinsona. [LINK]
👉 Amerykanie oczekują, że sztuczna inteligencja zwiększy długość życia. [LINK]
👉 Przełom w leczeniu raka piersi - sztuczna inteligencja przewiduje jedną trzecią przypadków przed postawieniem diagnozy na podstawie badania mammograficznego. [LINK]
|
|
|
|
👉 Szef DeepMind mówi otwarcie, że ryzyko związane ze sztuczną inteligencją należy traktować tak samo poważnie, jak kryzys klimatyczny. [LINK]
👉 Aktorzy z Hollywood podjęli strajk w obawie przed zastosowaniem sztucznej inteligencji, jednak Meta i firma Realeyes zatrudniły ich za niską kwotę 300 dolarów, aby wykorzystać ich umiejętności do nadawania bardziej ludzkiego wyglądu swoim awatarom. [LINK]
👉 Gromadzenie i wykorzystywanie danych osobowych przez systemy sztucznej inteligencji stwarza poważne ryzyko dla prywatności. [LINK]
👉 Oto lista dziesięciu dziwnych robotów. Patrząc na niektóre z nich, aż przeszły mi ciarki 😂. [LINK]
👉 Nowe badanie wykazało, że główne chatboty oparte na sztucznej inteligencji, takie jak ChatGPT i Google Bard, są podatne na rozpowszechnianie fałszywych lub zdemaskowanych informacji medycznych, gdy zadawane są im pewne pytania związane z rasą. [LINK]
|
|
|
|
👉 Hugging Face publikuje tabelę wyników rozpoznawania mowy. [LINK]
👉 Anthropic Hackathon w Londynie we współpracy z Cerebral Valley i Balderton (3-5 Listopad). [LINK]
|
|
|
|
Jeżeli chcesz być na bieżąco z tym, co się dzieje na moim blogu oraz otrzymywać więcej ciekawostek na temat Data Science, AI i ML to zapraszam na mój fanpage MirosławMamczur.pl na facebooku oraz MiroslawMamczur.pl na instagramie. |
|
|
|
Dziękuję, że czytasz mój newsletter i może mojego bloga!
Na koniec mam gorącą prośbę. Jeśli uważasz, że materiały, które przygotowuję są wartościowe, to będę bardzo wdzięczny za polecenie bloga osobom, którym mogą się przydać.
Pozdrawiam serdecznie,
|
|
|
|
|