Witaj!
Jak co piątek przybywam do Ciebie z porcją najświeższych wiadomości ze świata data science!
Przyjemnej lektury! |
|
|
|
HyperHuman 🏋️
👉 Pomimo znacznych postępów w modelach zamiany tekstu na obraz, osiągnięcie hiperrealistycznego obrazu człowieka dalej bywa trudnym zadaniem. Istniejące modele, takie jak Stable Diffusion i DALL·E 2, mają tendencję do generowania obrazów ludzi z niespójnymi częściami ciała lub nienaturalnymi pozami. Snap i CUHK przedstawiają HyperHuman – rozwiązanie tego problemu. Osiągnęli to dzięki stworzeniu ogromnej bazy danych o nazwie HumanVerse, zawierającej aż 340 milionów obrazów z kompleksowymi adnotacjami, takimi jak pozycja ciała, głębokość i normalna powierzchnia. Następnie stworzyli model, który jednocześnie przetwarza głębię oraz generuje obrazy w kolorze (RGB). Dodatkowo wprowadzili rafiner, który używa informacji o strukturze, aby generować bardziej szczegółowe obrazy o wyższej rozdzielczości. [LINK].
|
|
|
|
Amazon Sparrow 🦾
👉 Amazon przeprowadza gruntowną modernizację swoich centrów realizacji zamówień, wykorzystując sztuczną inteligencję i robotykę, aby przyspieszyć dostawy. Modernizacja Amazona polega na wprowadzeniu do magazynów robotów i AI, aby skrócić czas przetwarzania zamówień. Centralnym elementem jest ramię robota o nazwie Sparrow i nowy system sortowania o nazwie Sequoia. Razem skrócą one czas realizacji zamówień nawet o 25%, a identyfikacja zapasów będzie o 75% szybsza. Amazon twierdzi, że nowa technologia ma współpracować z ludźmi w celu ograniczenia obrażeń oraz jednocześnie automatyzacja nie będzie związana z eliminowaniem stanowisk pracy. Obawiam się jednak, że 100% osób nie będzie umieć się dostosować do nowej technologii. PS. Przypominam, że Amazon zaczął także testować w swoich fabrykach dwunożnego robota o nazwie Digit 😉. [LINK].
|
|
|
|
🤯 Obsesja OpenAI: AGI🧠
👉 Choć OpenAI od lat zapowiadało, że chce stworzyć AGI, to szczegóły nie są jasne. Firma w 2018 r. opisała AGI jako „wysoce autonomiczne systemy, które przewyższają ludzi w najbardziej wartościowej ekonomicznie pracy”. Sam Altman czasami mówił, że LLM to dopiero początek ich podróży w kierunku AGI. Natomiast OpenAI zmieniło niedawno podstawowe wartości wymienione na swojej stronie internetowej, kładąc nowy nacisk na rozwój sztucznej inteligencji ogólnej (AGI)! [LINK].
|
|
|
|
👉 Chiński gigant technologiczny Baidu zaprezentował najnowszy model sztucznej inteligencji Ernie 4.0, odważnie twierdząc, że dorównuje on możliwościom wiodących modeli, takich jak GPT-4. [LINK]
👉 PwC współpracuje z OpenAI i Harvey w celu szkolenia i wdrażania podstawowych modeli usług podatkowych, prawnych i HR. [LINK]
👉 Według The Information OpenAI wstrzymało rozwój nowego modelu sztucznej inteligencji o nazwie Arrakis po tym, jak nie udało mu się osiągnąć oczekiwanego wzrostu wydajności. [LINK]
👉 Foxconn i Nvidia budują „fabryki sztucznej inteligencji” – superkomputerowe centra danych, aby przyspieszyć rozwój samochodów autonomicznych, maszyn autonomicznych i robotów przemysłowych. [LINK]
👉 Stack Overflow zwalnia 28% personelu w związku z rozwojem AI. Cięcia dotkną zespoły sprzedaży i wsparcia, ponieważ generatywna sztuczna inteligencja w dalszym ciągu ogranicza podstawową działalność firmy. [LINK]
👉 Dyrektor generalny IBM, Arvind Krishna, argumentuje, że organy regulacyjne nie powinny pozwalać twórcom sztucznej inteligencji ukrywać się za szeroko zakrojoną ochroną prawną. [LINK]
👉 Usługa Google Search Generative Experience (SGE) umożliwia użytkownikom generowanie obrazów i wersji roboczych tekstu bezpośrednio z paska wyszukiwania. Oparty na rodzinie modeli sztucznej inteligencji Imagen, konkuruje z czatem Bing firmy Microsoft korzystającym z DALL-E OpenAI. [LINK]
|
|
|
|
👉 Według Reuters, OpenAI, twórca produktów generatywnej AI ChatGPT i DALL-E 3, bada możliwość wyprodukowania własnych chipów do trenowania AI. [LINK]
👉 Kanada pragnie być liderem w zakresie przepisów dotyczących sztucznej inteligencji, wprowadzając kodeks postępowania dla przedsiębiorstw prowadzących działalność w zakresie sztucznej inteligencji, aby zapewnić bezpieczeństwo i chronić interes publiczny. [LINK]
👉 Chatbot Pi uzyskuje dostęp do Internetu w czasie rzeczywistym. Nie ma wtyczki lub dodatkowego przełącznika. Po prostu porozmawiaj z Pi, aby uzyskać najnowsze informacje na interesujące Cię tematy. [LINK]
👉 BBC blokuje scrapowanie danych od OpenAI. [LINK]
👉 Startup Figure zajmujący się robotyką udostępnił nowy film przedstawiający humanoidalnego robota Figure 01 poruszającego się dynamicznie i niezależnie, co stanowi kamień milowy w robotyce. Całość zajęła im 12 miesięcy. Pokazuje to, że era robotów humanidalnych jest coraz bliżej. [LINK]
|
|
|
|
👉 Jak uczenie maszynowe wpływa na rekrutację. [LINK]
👉 Claude firmy Anthropic jest teraz dostępny w 95 krajach. Wyróżnia go możliwość czatowania z dłuższymi dokumentami (do 100 tys. tokenów)! W linku lista dostępnych krajów. [LINK]
👉 W wywiadzie dla Bloomberga, twórca Ghostwriter, zaproponował system wymiany informacji, w którym artyści mogliby licencjonować swoje głosy sztucznej inteligencji jako rozwiązanie w obliczu obaw związanych z klonowaniem głosu. [LINK]
👉 Firma BlackBerry ogłosiła wprowadzenie nowego, generatywnego asystenta AI, który wspiera zespoły ds. bezpieczeństwa w analizach. [LINK]
👉 Raytheon dodaje sztuczną inteligencję do oferty rozwiązań w zakresie cyberbezpieczeństwa. [LINK]
|
|
|
|
👉 Microsoft prezentuje Idea2Img — system wykorzystujący GPT-4V(ision) do wielomodalnego, iteracyjnego samodoskonalenia, przekształcając koncepcje wizualne w skuteczne podpowiedzi polegające na zamianie tekstu na obraz. [LINK]
|
|
|
|
👉 DeepMind i MIT przedstawiają Video Language Planning (VLP). [LINK]
👉 Meta przedstawia system sztucznej inteligencji działający w czasie rzeczywistym, wykorzystujący MEG do dekodowania i rekonstrukcji reprezentacji wizualnych w mózgu, pogłębiając wiedzę na temat przetwarzania obrazu i interfejsów mózg-komputer. [LINK]
|
|
|
|
👉 Northwestern University proponuje RAFA – nowatorską strukturę tworzącą wydajnego autonomicznego agenta LLM, który charakteryzuje się rozumowaniem długo- i krótkoterminowym. [LINK]
👉 Nvidia wprowadza SteerLM – technikę, która umożliwia dostosowywanie LLM w czasie rzeczywistym podczas wnioskowania, wykazując doskonałą wydajność w testach porównawczych i szerokie zastosowanie w grach, edukacji i przedsiębiorstwach. [LINK]
|
|
|
|
👉 Show Lab wprowadza MotionDirector - dostosowywanie ruchu w modelach generowania tekstu na wideo. [LINK]
👉 Google proponuje PaLI-3 – kompaktowy model języka wizyjnego o wielkości 5B, zapewniający wysoką wydajność porównywalną z modelami 10-krotnie większymi w 36 językach. [LINK]
|
|
|
|
👉 Salesforce przedstawia Lemur i Lemur-Chat — ogólnodostępne modele zoptymalizowane pod kątem języka naturalnego i możliwości kodowania, przewyższające istniejące modele typu open source, takie jak Llama2. [LINK]
👉 Badania wykazały, że ludzie znacznie częściej pracują opieszale w zespołach człowiek-robot. [LINK]
|
|
|
|
👉 Fuyu-8B — potężna multimodalna sztuczna inteligencja, która rozumie wykresy, dokumenty i interfejsy, otwierając drzwi zdolnym agentom AI, którzy potrafią poruszać się po interfejsach użytkownika! [LINK]
|
|
|
|
👉 Badacze wypuszczają CogVLM – podstawowy model języka wizyjnego o otwartym kodzie źródłowym, osiągający wydajność SOTA i pokonujący PALI-X firmy Google. [LINK]
👉 Firma Microsoft udostępnia HoloAssist — kompleksowy zestaw danych torujący drogę asystentom AI, biegłym w zakresie współpracy i wskazówek w świecie rzeczywistym. [LINK]
👉 MemGPT — platforma stworzona przez Uniwersytet Barkley, która rozszerza okna kontekstowe LLM, zwiększając ich użyteczność w dłuższych rozmowach i analizie dokumentów. [LINK]
👉 Badacze wypuszczają VideoCrafter1 - wysokiej jakości model Text2Video. [LINK]
|
|
|
|
👉 AudioSep - oddziela wszelkie dźwięki od sygnału wejściowego, np. gitara lub śmiech, używając tekstu. [LINK]
👉 Naukowcy opracowują 4K4D – nową technikę, która znacznie przyspiesza renderowanie wysokiej jakości scen 3D w czasie rzeczywistym, dzięki czemu jest ono szybsze i wydajniejsze. [LINK]
|
|
|
|
👉 DocsGPT to najnowocześniejsze rozwiązanie typu open source, które usprawnia proces wyszukiwania informacji w dokumentacji projektowej. [LINK]
👉 ToRA to seria agentów LLM zintegrowanych z narzędziami, zaprojektowanych w celu rozwiązywania trudnych problemów związanych z rozumowaniem matematycznym poprzez interakcję z narzędziami. [LINK]
|
|
|
|
👉 Obecny stan ciągłego uczenia się (ang. continual learning) w AI. [LINK]
👉 Niedługo minie prawie rok od uruchomienia ChatGPT! Generatywna sztuczna inteligencja z pewnością weszła do głównego nurtu. Jeśli chcesz nadrobić podstawy z tego tematu, to polecam ten elementarz. [LINK]
👉 Ten kurs wprowadza w potężne narzędzia generatywnej sztucznej inteligencji, takie jak ChatGPT i Chatboty Zapier OpenAI, i prezentuje sposoby wykorzystania ich w pracy. [LINK]
👉 Jak rozmawiać z LLM (głosem). [LINK]
👉 W artykule pokazano jak w pythonie na 7 sposobów można przygotować zmienne (ang. feature engineering) pod szeregi czasowe. [LINK]
👉 Szkolenie AI do gry w Pokemony z uczeniem się przez wzmacnianie. [LINK]
|
|
|
|
👉 Poradnik pokazujący, jak dostroić Mistral 7B za pomocą QLoRA i wdrożyć go za pomocą DLC Hugging Face LLM Inference. [LINK]
👉 Artykuł wyjaśniający prosty, ale potężny pomysł łączenia profili użytkowników i atrybutów przedmiotów w celu generowania spersonalizowanych rekomendacji treści za pomocą LLM. [LINK]
👉 Samouczek PyTorch dotyczący korzystania z interfejsów API z prostym modelem opakowanym FSDP. [LINK]
👉 Jak działa QLoRA, umożliwiając dostrojenie modeli mających miliardy parametrów na stosunkowo małym procesorze graficznym. [LINK]
👉 Dlaczego odpływ klientów ma znaczenie i jak go przewidzieć za pomocą uczenia maszynowego - wyjaśnionienie krok po kroku. [LINK]
|
|
|
|
👉 Antropia dostarcza dowodów empirycznych na to, że istnieje więcej informacyjnych jednostek analizy niż pojedyncze neurony. [LINK]
👉 Ten interaktywny quiz przetestuje Twoją wiedzę o Pythonie i przy okazji pokaże Ci pewne niuanse tego języka. [LINK]
👉 Jeśli prezentujesz dużo danych, a wizualizacja albo się przewija, albo zajmuje dużo miejsca, czytelnicy mogą zgubić klucze kolorów i błędnie zinterpretować dane. W tym poście omówiono sposoby, dzięki którym nie zapomnisz kluczy kolorów. [LINK]
|
|
|
|
👉 Firma Anthropic pozwoliła 1000 osobom zasugerować zasady działania swojego chatbota Claude, a następnie przeszkoliła miniwersję na temat „konstytucji publicznej”. Pochodzący z crowdsourcingu Claude podczas eksperymentów zachowywał się podobnie do oryginału firmy, co sugeruje, że zbiorowe zarządzanie może zadziałać. [LINK]
👉 ChatGPT przewyższa lekarzy w przestrzeganiu klinicznych wytycznych dotyczących leczenia depresji. [LINK]
👉 Miasto Nowy Jork przedstawiło nowy plan wykorzystania sztucznej inteligencji do usprawnienia działania władz. Plan obejmuje 37 kluczowych zadań, takich jak utworzenie zewnętrznej sieci doradczej, edukowanie pracowników miasta na temat sztucznej inteligencji oraz ustalenie polityki dotyczącej narzędzi algorytmicznych wykorzystywanych przez agencje miejskie. Miasto zdaje sobie sprawę z potencjalnej stronniczości w sztucznej inteligencji i ma na celu ocenę ryzyka i skuteczności narzędzi. [LINK]
👉 Student informatyki z Uniwersytetu Nebraska-Lincoln wykorzystał sztuczną inteligencję do pierwszego w historii rozszyfrowania słów ze zwęglonego zwoju z miasta Herkulanum, które zostało zakopane podczas erupcji Wezuwiusza w 79 r. n.e. [LINK]
|
|
|
|
👉 Uniwersytet Princeton i Virginia Tech pokazują, jak dostosowanie bezpieczeństwa zastrzeżonych rozwiązań LLM, takich jak ChatGPT, może zostać zagrożone poprzez dostrojenie na podstawie zaledwie kilku kontradyktoryjnych przykładów. [LINK]
|
|
|
|
👉 Współczesne przedsiębiorstwa zawsze poszukują sposobów na optymalizację swoich działań i zwiększenie produktywności. Tak powstały aplikacje do śledzenia pracowników, które z perspektywy dużych organizacji okazały się nieocenione pomagając im wydajnie i skutecznie zarządzać personelem. Teraz następuje rewolucja poprzez dodanie do nich AI. Jak to wpłynie na pracowników? Czas pokaże. [LINK]
👉 Burmistrz Nowego Jorku Eric Adams podobno wdrożył narzędzia sztucznej inteligencji, aby wykonywać automatyczne połączenia z mieszkańcami w językach, których w rzeczywistości nie zna, co wprawiało wyborców w dezorientację i kwestionowało etykę technologii. [LINK]
👉 Pracownicy z Uniwersytetu Stanforda, MIT i Princeton połączyli siły i stworzyli nowy indeks o nazwie Foundation Model Transparency Index (FMTI), aby mierzyć poziom przejrzystości firm na podstawie 100 wskaźników. Okazuje się, że najlepsze modele AI oferują niewielką przejrzystość, nawet te o otwartym kodzie źródłowym. [LINK]
|
|
|
|
👉 Naukowcom z Uniwersytetu w Jyväskylä udało się uprościć najpopularniejszą technikę sztucznej inteligencji, czyli głębokie uczenie się, wykorzystując XVIII-wieczną matematykę. [LINK]
👉 Finaliści multimodalnego hackatonu AI TED. [LINK]
👉 Runway ML uruchamia Program Akceleracyjny, który ma pomóc wyjątkowym inżynierom oprogramowania stać się praktykami ML. Będzie to 3-miesięczny program, w ramach którego otrzymasz wynagrodzenie jako pełnoetatowy pracownik Runway pracujący nad bieżącymi projektami. [LINK]
|
|
|
|
Jeżeli chcesz być na bieżąco z tym, co się dzieje na moim blogu oraz otrzymywać więcej ciekawostek na temat Data Science, AI i ML to zapraszam na mój fanpage MirosławMamczur.pl na facebooku oraz MiroslawMamczur.pl na instagramie. |
|
|
|
Dziękuję, że czytasz mój newsletter i może mojego bloga!
Na koniec mam gorącą prośbę. Jeśli uważasz, że materiały, które przygotowuję są wartościowe, to będę bardzo wdzięczny za polecenie bloga osobom, którym mogą się przydać.
Pozdrawiam serdecznie,
|
|
|
|
|