Licencjonowanie może być inte(R)esujące

Dwa dni temu publikując wpis dot. nowego e-booka z dziedziny data science, obiecałem, że wrócę do kwestii licencjonowania produktów rodziny R. Krótkie przypomnienie, Microsoft oferuje obecnie w swoim portfolio 3 różne produkty, które pozwalają na realizację zaawansowanej analityki z wykorzystaniem języka R:

  • R Open
  • SQL R Services/R Standalone dla  Windows
  • R Server
    • Hadoop
    • Linux
    • Teradata

Na początek coś co zawsze cieszy, czyli wersja zupełnie darmowa:

RRO

Microsoft R Open, wcześniej znany jako  Revolution R Open (RRO). Jest to pełni kompletna platforma pozwalająca na analizę statystyczną oraz wszelkiego rodzaju eksperymenty w obszarze data science. Platforma udostępniana jest na licencji  open source, co oznacza prawo do jej swobodnego pobierania, wykorzystywania i współdzielenia. Obecnie dostępna jest wersja Microsoft R Open 3.3.1, która jest w 100% kompatybilna z R-3.3.1. Dlaczego zatem warto zainteresować się właśnie R Open – dodatkowym atutem Microsoft R Open są usprawnienia w obszarze wydajności (m.in. wielowątkowa obsługa bibliotek matematycznych – przykład wpływu na wydajność w tabli poniżej), niezmienność bibliotek ( Microsoft oferuje możliwość korzystania z zamrożonych wersji bibliotek repozytorium CRAN), a także możliwość wykorzystania rozwiązania na platformach Windows oraz Linux-based.

Poniżej przykładowe zestawienie wydajnościowe w zależności od platformy sprzętowej i środowiska R:

Elapsed Time (Table)Źródło: https://mran.microsoft.com/documents/rro/multithread/#mt-bench

Jeśli chcesz rozpocząć przygodę z R zupełnie za darmo, można skorzystać właśnie z Microsoft R Open.

Druga opcja na liście to wykorzystanie silnika R w formie zintegrowanej z silnikiem SQL Server. R Services (in-database), bo tak nazwana została ta opcja, to nic innego jak pełne środowisko uruchomieniowe dla R związane bezpośrednio z silnikiem relacyjnych baz danych. R Services są częścią procesu instalacyjnego SQL Server. Technicznie jest to dodatkowa usługa działająca równolegle z usługą SQL Server, na tym samym serwerze.  Uwzględniając tak „bliską” przyjaźń R i SQL Server łatwo można odpowiedzieć na pytanie dot. sposobu licencjonowania w takiej opcji uruchomienia. R Services jako, że wymagają do działania SQL Server traktowane są jako komponent platformy SQL Server, tym samym przyjmują dokładnie taki sam model licencjonowania jak SQL Server.

Alternatywną formą instalacji środowiska R, opartego również o model licencjonowania całej platformy SQL Server jest opcja R Standalone dla Windows. Opcja pozwala na uruchomienie niezależnie od środowiska SQL Server środowiska R, które w tym przypadku również jest licencjonowanie dokładnie tak jak sama platforma SQL Server i wymaga licencji właśnie na ten produkt. Warto tutaj zaznaczyć, że podobnie jak dla samego SQL server w przypadku R Standalone dla Windows obowiązuje minimalne wymaganie 4 licencji na rdzeń dla każdego procesora w przypadku instalacji na serwerach o mniejszej liczbie rdzeni per procesor.

Reasumując, w przypadku wykorzystania opcji R-Services lub R Standalone dla Windows obowiązują zasady licencjonowania platformy SQL Server.

Ostatnią grupą produktów są 3 wersje R Server. Tutaj w zależności o wybranej wersji zetkniemy się z nieco innym modelem licencjonowania:

R Server dla Linux – licencjonowanie w modelu rdzeni. Licencje nabywane są na fizyczne/wirtualne rdzenie serwera, z zachowaniem wymagania minimum 4 licencji na rdzeń dla każdego procesora

ostatnim, tym chyba najbardziej ciekawym modelem jest licencjonowanie:

R Server dla Hadoop oraz Teradata. 

Muszę przyznać, że kiedy po raz pierwszy zobaczyłem model licencjonowania tych produktów nieco się zdziwiłem, bo jest nic innego, jak kolejny model wprowadzony do kanonu licencjonowania Microsoft. W przypadku tych produktów pojawia się model licencjonowania na serwer (1 serwer = 1 licencja), co w tym takiego nowego? Otóż każda licencja dla R Server Hadoop /Teradata ograniczona jest do maksymalnie 24 rdzeni. Co oznacza, że w przypadku instalacji na serwerach z większą ilością rdzeni, odpowiednio potrzebna będzie większa liczba licencji przypisanych do serwera. R Server Hadoop/Teradata występuję jako zupełnie odrębne SKU w cennikach, także jeśli jest to produkt, który Cię zainteresował zachęcam do poznania szczegółów dotyczących dostępności w umowach licencjonowania zbiorowego.

Warto również podkreślić, że wszystkie produkty rodziny R (za wyjątkiem R Server Teradata) dostępne są również w ramach umowy SPLA, czyli Service Provider License Agreement, co oznacza, że jeśli prowadzisz firmę hostingową i chcesz zaoferować swoim klientom platformę R jest to w pełni możliwy scenariusz  – czyli czas na RaaS (R as a Service) 🙂

2 Replies to “Licencjonowanie może być inte(R)esujące”

Comments are closed.