6004eff6e05b6d24ec7bb98f6d70a6a231117d67
[sixth-data.git] / doc / index.html
1 <!doctype html>
2 <html lang="en">
3 <head>
4 <title>Sixth Data - Data storage and computing engine</title>
5 <!-- 2019-01-19 Sat 01:43 -->
6 <meta charset="utf-8">
7 <meta name="viewport" content="width=device-width, initial-scale=1">
8 <meta name="generator" content="Org-mode">
9 <meta name="author" content="Svjatoslav Agejenko">
10 <link href="https://bootswatch.com/3/darkly/bootstrap.min.css" rel="stylesheet">
11 <script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/1.11.3/jquery.min.js"></script>
12 <script src="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/3.3.5/js/bootstrap.min.js"></script>
13 <style type="text/css">
14 footer {background-color: #111 !important;}
15 pre {background-color: #111; color: #ccc;}
16 </style>
17 <style type="text/css">
18 /* org mode styles on top of twbs */
19
20 html {
21     position: relative;
22     min-height: 100%;
23 }
24
25 body {
26     font-size: 18px;
27     margin-bottom: 105px;
28 }
29
30 footer {
31     position: absolute;
32     bottom: 0;
33     width: 100%;
34     height: 101px;
35     background-color: #f5f5f5;
36 }
37
38 footer > div {
39     padding: 10px;
40 }
41
42 footer p {
43     margin: 0 0 5px;
44     text-align: center;
45     font-size: 16px;
46 }
47
48 #table-of-contents {
49     margin-top: 20px;
50     margin-bottom: 20px;
51 }
52
53 blockquote p {
54     font-size: 18px;
55 }
56
57 pre {
58     font-size: 16px;
59 }
60
61 .footpara {
62     display: inline-block;
63 }
64
65 figcaption {
66   font-size: 16px;
67   color: #666;
68   font-style: italic;
69   padding-bottom: 15px;
70 }
71
72 /* from twbs docs */
73
74 .bs-docs-sidebar.affix {
75     position: static;
76 }
77 @media (min-width: 768px) {
78     .bs-docs-sidebar {
79         padding-left: 20px;
80     }
81 }
82
83 /* All levels of nav */
84 .bs-docs-sidebar .nav > li > a {
85     display: block;
86     padding: 4px 20px;
87     font-size: 14px;
88     font-weight: 500;
89     color: #999;
90 }
91 .bs-docs-sidebar .nav > li > a:hover,
92 .bs-docs-sidebar .nav > li > a:focus {
93     padding-left: 19px;
94     color: #A1283B;
95     text-decoration: none;
96     background-color: transparent;
97     border-left: 1px solid #A1283B;
98 }
99 .bs-docs-sidebar .nav > .active > a,
100 .bs-docs-sidebar .nav > .active:hover > a,
101 .bs-docs-sidebar .nav > .active:focus > a {
102     padding-left: 18px;
103     font-weight: bold;
104     color: #A1283B;
105     background-color: transparent;
106     border-left: 2px solid #A1283B;
107 }
108
109 /* Nav: second level (shown on .active) */
110 .bs-docs-sidebar .nav .nav {
111     display: none; /* Hide by default, but at >768px, show it */
112     padding-bottom: 10px;
113 }
114 .bs-docs-sidebar .nav .nav > li > a {
115     padding-top: 1px;
116     padding-bottom: 1px;
117     padding-left: 30px;
118     font-size: 12px;
119     font-weight: normal;
120 }
121 .bs-docs-sidebar .nav .nav > li > a:hover,
122 .bs-docs-sidebar .nav .nav > li > a:focus {
123     padding-left: 29px;
124 }
125 .bs-docs-sidebar .nav .nav > .active > a,
126 .bs-docs-sidebar .nav .nav > .active:hover > a,
127 .bs-docs-sidebar .nav .nav > .active:focus > a {
128     padding-left: 28px;
129     font-weight: 500;
130 }
131
132 /* Nav: third level (shown on .active) */
133 .bs-docs-sidebar .nav .nav .nav {
134     padding-bottom: 10px;
135 }
136 .bs-docs-sidebar .nav .nav .nav > li > a {
137     padding-top: 1px;
138     padding-bottom: 1px;
139     padding-left: 40px;
140     font-size: 12px;
141     font-weight: normal;
142 }
143 .bs-docs-sidebar .nav .nav .nav > li > a:hover,
144 .bs-docs-sidebar .nav .nav .nav > li > a:focus {
145     padding-left: 39px;
146 }
147 .bs-docs-sidebar .nav .nav .nav > .active > a,
148 .bs-docs-sidebar .nav .nav .nav > .active:hover > a,
149 .bs-docs-sidebar .nav .nav .nav > .active:focus > a {
150     padding-left: 38px;
151     font-weight: 500;
152 }
153
154 /* Show and affix the side nav when space allows it */
155 @media (min-width: 992px) {
156     .bs-docs-sidebar .nav > .active > ul {
157         display: block;
158     }
159     /* Widen the fixed sidebar */
160     .bs-docs-sidebar.affix,
161     .bs-docs-sidebar.affix-bottom {
162         width: 213px;
163     }
164     .bs-docs-sidebar.affix {
165         position: fixed; /* Undo the static from mobile first approach */
166         top: 20px;
167     }
168     .bs-docs-sidebar.affix-bottom {
169         position: absolute; /* Undo the static from mobile first approach */
170     }
171     .bs-docs-sidebar.affix .bs-docs-sidenav,.bs-docs-sidebar.affix-bottom .bs-docs-sidenav {
172         margin-top: 0;
173         margin-bottom: 0
174     }
175 }
176 @media (min-width: 1200px) {
177     /* Widen the fixed sidebar again */
178     .bs-docs-sidebar.affix-bottom,
179     .bs-docs-sidebar.affix {
180         width: 263px;
181     }
182 }
183 </style>
184 <script type="text/javascript">
185 $(function() {
186     'use strict';
187
188     $('.bs-docs-sidebar li').first().addClass('active');
189
190     $(document.body).scrollspy({target: '.bs-docs-sidebar'});
191
192     $('.bs-docs-sidebar').affix();
193 });
194 </script>
195 </head>
196 <body>
197 <div id="content" class="container">
198 <div class="row"><div class="col-md-9"><h1 class="title">Sixth Data - Data storage and computing engine</h1>
199
200 <div id="outline-container-sec-1" class="outline-2">
201 <h2 id="sec-1"><span class="section-number-2">1</span> General</h2>
202 <div class="outline-text-2" id="text-1">
203 <ul class="org-ul">
204 <li>This is a subproject of <a href="https://www3.svjatoslav.eu/projects/sixth/">Sixth</a>
205 </li>
206
207 <li>This program is free software: you can redistribute it and/or modify
208 it under the terms of the <a href="https://www.gnu.org/licenses/lgpl.html">GNU Lesser General Public License</a> as
209 published by the Free Software Foundation, either version 3 of the
210 License, or (at your option) any later version.
211 </li>
212
213 <li>Program author:
214 <ul class="org-ul">
215 <li>Svjatoslav Agejenko
216 </li>
217 <li>Homepage: <a href="https://svjatoslav.eu">https://svjatoslav.eu</a>
218 </li>
219 <li>Email: <a href="mailto://svjatoslav@svjatoslav.eu">mailto://svjatoslav@svjatoslav.eu</a>
220 </li>
221 </ul>
222 </li>
223
224 <li><a href="https://www.svjatoslav.eu/projects/">Other software projects hosted at svjatoslav.eu</a>
225 </li>
226 </ul>
227 </div>
228
229 <div id="outline-container-sec-1-1" class="outline-3">
230 <h3 id="sec-1-1"><span class="section-number-3">1.1</span> Source code</h3>
231 <div class="outline-text-3" id="text-1-1">
232 <ul class="org-ul">
233 <li><a href="https://www2.svjatoslav.eu/gitweb/?p=sixth-data.git;a=snapshot;h=HEAD;sf=tgz">Download latest snapshot in TAR GZ format</a>
234 </li>
235
236 <li><a href="https://www2.svjatoslav.eu/gitweb/?p=sixth-data.git;a=summary">Browse Git repository online</a>
237 </li>
238
239 <li>Clone Git repository using command:
240 <pre class="example">
241 git clone https://www2.svjatoslav.eu/git/sixth-data.git
242
243 </pre>
244 </li>
245
246 <li>See <a href="https://www3.svjatoslav.eu/projects/sixth-data/apidocs/">JavaDoc</a>.
247 </li>
248 </ul>
249 </div>
250 </div>
251 </div>
252
253 <div id="outline-container-sec-2" class="outline-2">
254 <h2 id="sec-2"><a id="ID-f6764282-a6f6-44e6-8716-b428074dd093" name="ID-f6764282-a6f6-44e6-8716-b428074dd093"></a><span class="section-number-2">2</span> Vision / goal</h2>
255 <div class="outline-text-2" id="text-2">
256 <p>
257 Provide versioned, clustered, flexible, distributed, multi-dimensional
258 data storage engine for the <a href="http://www2.svjatoslav.eu/gitbrowse/sixth/doc/index.html">Sixth computation engine</a>.
259 </p>
260
261 <ul class="org-ul">
262 <li>Speaking of traditional relational database and object oriented
263 business applications:
264
265 <ul class="org-ul">
266 <li>I hate object-relational impedance mismatch.
267 </li>
268
269 <li>I don't like to convert data between persistent database and
270 runtime objects for every transaction. How about creating united
271 database/computation engine instead to:
272 </li>
273
274 <li>Eliminate constant moving and converting of data between 2 systems
275 and make computing happen close to where the data is stored.
276 </li>
277
278 <li>Abstract away difference between RAM VS persistent storage. Let
279 the system decide at runtime which data to keep in what kind of
280 memory.
281 </li>
282 </ul>
283 </li>
284 </ul>
285 </div>
286 </div>
287
288 <div id="outline-container-sec-3" class="outline-2">
289 <h2 id="sec-3"><span class="section-number-2">3</span> Inspiration</h2>
290 <div class="outline-text-2" id="text-3">
291 <ul class="org-ul">
292 <li>Relational databases:
293 <ul class="org-ul">
294 <li>Transactional.
295 </li>
296 <li>Indexable / Quickly searchable.
297 </li>
298 </ul>
299 </li>
300
301 <li>Git (version control system)
302 <ul class="org-ul">
303 <li>Versionable
304 </li>
305 <li>Branchable / mergeable.
306 </li>
307 <li>Transparent cansistency, checksumming and deduplication.
308 </li>
309 <li>(Git as a database:
310 </li>
311 </ul>
312 <p>
313 <a href="https://www.kenneth-truyers.net/2016/10/13/git-nosql-database/">https://www.kenneth-truyers.net/2016/10/13/git-nosql-database/</a> )
314 </p>
315 </li>
316 </ul>
317 </div>
318
319 <div id="outline-container-sec-3-1" class="outline-3">
320 <h3 id="sec-3-1"><a id="ID-d2375acc-af14-4f18-8ad0-7949501178c5" name="ID-d2375acc-af14-4f18-8ad0-7949501178c5"></a><span class="section-number-3">3.1</span> Brain</h3>
321 <div class="outline-text-3" id="text-3-1">
322 <ul class="org-ul">
323 <li>Brain appears to have more than 3D dimensional design:
324 <a href="https://singularityhub.com/2017/06/21/is-there-a-multidimensional-mathematical-world-hidden-in-the-brains-computation/">https://singularityhub.com/2017/06/21/is-there-a-multidimensional-mathematical-world-hidden-in-the-brains-computation/</a>
325 </li>
326
327 <li>Brain appears to use geometry to map thoughts and even sounds:
328 <a href="https://www.quantamagazine.org/the-brain-maps-out-ideas-and-memories-like-spaces-20190114/">https://www.quantamagazine.org/the-brain-maps-out-ideas-and-memories-like-spaces-20190114/</a>
329 </li>
330 </ul>
331
332
333 <ul class="org-ul">
334 <li>It directly inspires following ideas
335 <ul class="org-ul">
336 <li><a href="#sec-4-1">Distributed comutation and data storage</a>
337 </li>
338 <li><a href="#sec-4-2">Mapping of hyperspace to traditional object-oriented model</a>
339 </li>
340 <li><a href="#sec-4-3">Handling of relations</a>
341 </li>
342 </ul>
343 </li>
344 </ul>
345 </div>
346 </div>
347 </div>
348 <div id="outline-container-sec-4" class="outline-2">
349 <h2 id="sec-4"><span class="section-number-2">4</span> Ideas</h2>
350 <div class="outline-text-2" id="text-4">
351 </div><div id="outline-container-sec-4-1" class="outline-3">
352 <h3 id="sec-4-1"><a id="ID-5d287158-53ea-44a2-a754-dd862366066a" name="ID-5d287158-53ea-44a2-a754-dd862366066a"></a><span class="section-number-3">4.1</span> Distributed computation and data storage</h3>
353 <div class="outline-text-3" id="text-4-1">
354 <p>
355 Maybe every problem can be translated to geometry (use any shapes and
356 as many dimensions as you need). Solution(s) to such problems would
357 then appear as relatively simple search/comparison/lookup results. As
358 a bonus, such geometrical *data storage* AND *computation* can be
359 naturally made in *parallel* and *distributed*. That's what neurons in
360 the brain appear to be doing ! :) . Learning means building/updating
361 the model (the hard part). Question answering is making (relatively
362 simple) lookups (geometrical queries) against the model.
363 </p>
364 </div>
365 </div>
366 <div id="outline-container-sec-4-2" class="outline-3">
367 <h3 id="sec-4-2"><a id="ID-a117c11e-97c1-4822-88b2-9fc10f96caec" name="ID-a117c11e-97c1-4822-88b2-9fc10f96caec"></a><span class="section-number-3">4.2</span> Mapping of hyperspace to traditional object-oriented model</h3>
368 <div class="outline-text-3" id="text-4-2">
369 <p>
370 Object oriented programming is inspired by the way human mind
371 operates. It allows programmer to express ideas to computer in a more
372 human-like terms.
373 </p>
374
375 <p>
376 It is possible to map object model to geometrical hyperspace:
377 </p>
378
379 <ul class="org-ul">
380 <li>Object is a point in space (universe). Each object member variable
381 translates to its own dimension. That is: if class declares 4
382 variables for an object, then corresponding object can be stored as
383 a single point inside 4 dimensional space. Variable values translate
384 to point coordinates in space. That is: Integer, floating point
385 number and even boolean and string can be translated to linear value
386 that can be used as a coordinate along particular dimension.
387 </li>
388
389 <li>Each class declares its own space (universe). All class instances
390 (objects) are points inside that particular universe. References
391 between objects of different types are hyperlinks (portals) between
392 different universes.
393 </li>
394 </ul>
395 </div>
396 </div>
397 <div id="outline-container-sec-4-3" class="outline-3">
398 <h3 id="sec-4-3"><a id="ID-b6b15bd2-c78b-4c51-a343-72843a515c29" name="ID-b6b15bd2-c78b-4c51-a343-72843a515c29"></a><span class="section-number-3">4.3</span> Handling of relations</h3>
399 <div class="outline-text-3" id="text-4-3">
400 <p>
401 Consider we want to create database of books and authors. Book can
402 have multiple authors, and single person can be author for multiple
403 books. It is possible to store how many hours of work each author has
404 contributed to every book, using hyperspace as follows:
405 </p>
406
407 <ul class="org-ul">
408 <li>Every dimension corresponds to one particular book author. (10
409 authors in the database, would require 10 dimensional space)
410 <ul class="org-ul">
411 <li>Point in space corresponds to one particular book.
412 <ul class="org-ul">
413 <li>Point location along particular (author) dimension corresponds
414 to amount of work contributed by particular author for given
415 book.
416 </li>
417 </ul>
418 </li>
419 </ul>
420 </li>
421 </ul>
422
423 <p>
424 Alternatively:
425 </p>
426
427 <ul class="org-ul">
428 <li>Every dimension corresponds to one particular book.
429 <ul class="org-ul">
430 <li>Point in space corresponds to one particular author in the entire
431 database.
432 <ul class="org-ul">
433 <li>Point location along particular (book) dimension corresponds to
434 amount of work contributed for book by given author (point).
435 </li>
436 </ul>
437 </li>
438 </ul>
439 </li>
440 </ul>
441 </div>
442 </div>
443
444 <div id="outline-container-sec-4-4" class="outline-3">
445 <h3 id="sec-4-4"><span class="section-number-3">4.4</span> Layered architecture</h3>
446 <div class="outline-text-3" id="text-4-4">
447 <dl class="org-dl">
448 <dt> layer 1 </dt><dd>disk / block storage / partition
449 </dd>
450
451 <dt> layer 2 </dt><dd>key/value storage. Keys are unique and are dictated by
452 storage engine. Value is arbitrary but limited size byte
453 array. This layer is responsible for handling disk
454 defragmentation and consistency in case of crash
455 recovery.
456 </dd>
457
458 <dt> layer 3 </dt><dd>key/value storage. Keys are content hashes. Values are
459 arbitrary but limited size content byte arrays. This
460 layer effectively implements content addressable
461 storage. Content addressible storage enables GIT-like
462 behavior (possibility for competing branches, retaining
463 history, transparent deduplication)
464 </dd>
465
466 <dt> layer 4 </dt><dd>Implements arbitrary dimensional multiverse.
467 </dd>
468
469 <dt> layer 5 </dt><dd>Distributed computation engine.
470 </dd>
471 </dl>
472 </div>
473 </div>
474 </div>
475 <div id="outline-container-sec-5" class="outline-2">
476 <h2 id="sec-5"><span class="section-number-2">5</span> Current status</h2>
477 <div class="outline-text-2" id="text-5">
478 <ul class="org-ul">
479 <li>More or less defined <a href="#sec-2">Vision / goal</a>.
480 </li>
481
482 <li>Collected some <a href="#sec-3-1">ideas</a>.
483 </li>
484
485 <li>Implemented very simple persistent key-value map.
486 <ul class="org-ul">
487 <li>Long term goal is to use it as a backing storage engine and
488 implement more advanced features on top of this.
489 </li>
490 </ul>
491 </li>
492 </ul>
493 </div>
494 </div>
495
496 <div id="outline-container-sec-6" class="outline-2">
497 <h2 id="sec-6"><span class="section-number-2">6</span> See also</h2>
498 <div class="outline-text-2" id="text-6">
499 <p>
500 Interesting or competing projects with good ideas:
501 </p>
502
503 <ul class="org-ul">
504 <li>GRAKN.AI
505 <ul class="org-ul">
506 <li>database in the form of a knowledge graph that uses machine
507 reasoning to simplify data processing challenges for AI
508 applications. <a href="https://grakn.ai/">https://grakn.ai/</a>
509 </li>
510 </ul>
511 </li>
512
513 <li><a href="http://wiki.squeak.org/squeak/2665">Magma</a>
514 <ul class="org-ul">
515 <li>Multi-user object database for Squeak
516 </li>
517 </ul>
518 </li>
519
520 <li><a href="http://esug.org/data/ESUG2015/3%20wednesday/1100-1130%20SQL%20Queries%20on%20Smalltalk%20Objects/SQL%20Queries%20in%20Smalltalk%20(James%20Foster).pdf">Gemstone/S</a>
521 <ul class="org-ul">
522 <li>Completely distributed smalltalk based computing
523 system.
524 </li>
525 </ul>
526 </li>
527
528 <li><a href="http://www.uruk.org/emu/Taos.html">TAOS</a>
529 <ul class="org-ul">
530 <li>Completely distributed operating system/virtual machine:
531 </li>
532 </ul>
533 </li>
534
535 <li><a href="https://github.com/vygr/ChrysaLisp">ChrysaLisp</a>
536 <ul class="org-ul">
537 <li>Assembler/C-Script/Lisp 64 bit, MIMD, multi CPU, multi threaded,
538 multi core, multi user Parallel OS. With GUI, Terminal, OO
539 Assembler, Class libraries, C-Script compiler, Lisp interpreter,
540 Debugger, and more&#x2026;
541 </li>
542 </ul>
543 </li>
544 </ul>
545 </div>
546 </div>
547 </div><div class="col-md-3"><nav id="table-of-contents">
548 <div id="text-table-of-contents" class="bs-docs-sidebar">
549 <ul class="nav">
550 <li><a href="#sec-1">1. General</a>
551 <ul class="nav">
552 <li><a href="#sec-1-1">1.1. Source code</a></li>
553 </ul>
554 </li>
555 <li><a href="#sec-2">2. Vision / goal</a></li>
556 <li><a href="#sec-3">3. Inspiration</a>
557 <ul class="nav">
558 <li><a href="#sec-3-1">3.1. Brain</a></li>
559 </ul>
560 </li>
561 <li><a href="#sec-4">4. Ideas</a>
562 <ul class="nav">
563 <li><a href="#sec-4-1">4.1. Distributed computation and data storage</a></li>
564 <li><a href="#sec-4-2">4.2. Mapping of hyperspace to traditional object-oriented model</a></li>
565 <li><a href="#sec-4-3">4.3. Handling of relations</a></li>
566 <li><a href="#sec-4-4">4.4. Layered architecture</a></li>
567 </ul>
568 </li>
569 <li><a href="#sec-5">5. Current status</a></li>
570 <li><a href="#sec-6">6. See also</a></li>
571 </ul>
572 </div>
573 </nav>
574 </div></div></div>
575 <footer id="postamble" class="">
576 <div><p class="author">Author: Svjatoslav Agejenko</p>
577 <p class="date">Created: 2019-01-19 Sat 01:43</p>
578 <p class="creator"><a href="http://www.gnu.org/software/emacs/">Emacs</a> 26.1 (<a href="http://orgmode.org">Org-mode</a> 9.1.9)</p>
579 </div>
580 </footer>
581 </body>
582 </html>